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通信 和 网络 设计 、VLSI 布 局 和 DNA 序 列 分 析 是 重要 而 具有 挑战 性 的 问题 ， 不 能 用 初级 算法 
解决 。 因 此 ， 对 于 计算 机 科学 家 来 说 ， 掌 握 良 好 的 算法 设计 和 分 析 的 知识 系统 是 十 分 重要 的 。 

本 书 从 算法 策略 的 角度 来 描述 算法 设计 。 每 个 策略 包含 许多 基于 此 策略 的 算法 设计 。 对 
于 每 个 算法 ， 用 丰富 的 实例 进行 诠释 。 另 外 ， 每 个 例子 都 采用 详细 的 图 示 。 

近年 来 ， 许 多 近似 算法 相继 开发 出 来 。 本 书 清晰 地 描述 了 其 中 的 两 个 重要 概念 : PTAS 和 
NPO 完 全 性 。 在 介绍 近似 算法 之 前 ， 本 书 对 NP 完全 性 的 概念 进行 了 讨论 ， 并 通过 大 量 的 具体 
实例 进行 解释 ， 目 的 是 使 学 生 对 这 个 很 抽象 的 概念 有 明确 的 认识 。 

另外 ， 本 书 还 介绍 了 在 线 算 法 的 专题 ， 每 个 在 线 算法 通过 先 描述 其 内 在 的 基本 原理 来 展 
开 介绍 。 分 摊 分 析 是 算法 研究 的 一 个 新 领域 ， 本 书 对 这 个 不 易 理解 的 新 概念 也 进行 了 详细 的 
介绍 。 

本 书 可 以 作为 计算 机 科学 专业 高 年 级 本 科 生 或 硕士 研究 生 的 教材 使 用 。 
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本 书 在 介绍 算法 时 ， 重 点 介绍 用 于 设计 算法 的 策略 ， 非 常 与 众 不 同 。 书 中 介绍 了 前 枝 
搜索 、 分 摊 分 析 、 随 机 算法 、 在 线 算法 以 及 多 项 式 近 似 方案 等 相对 较 新 的 思想 和 众多 基于 分 
摊 分 析 新 开发 的 算法 ， 每 个 算法 都 与 实例 一 起 加 以 介绍 ， 而 且 每 个 例子 都 利用 图 进行 详细 解 
释 。 此 外 ， 本 书 还 提供 了 超过 400 幅 图 来 帮助 初学 者 理解 。 

本 书 适 合作 为 高 等 院 校 算法 设计 与 分 析 课 程 的 高 年 级 本 科 生 和 低 年 级 研究 生 的 教材 ， 
也 可 供 相关 科技 人 员 和 专业 人 士 参考 使 用 。 
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出 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 芍 断 性 的 优势 ， 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭 媒 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ， 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 得、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积 淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 
设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 图 文 信息 有 限 公 司 较 早 意 识 到 “出 版 要 为 教育 服务 ”"。 自 1998 年 开始 ， 
化 音 公 司 就 将 工作 重点 放 在 了 六 选 、 移 译 国 外 优秀 教材 上 。 经 过 几 年 的 不 懈 努 力 ， 我 们 与 
Prentice Hall, Addison-Wesley, McGraw-Hill, Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 甄选 出 Tanenbaum ，Stroustrup ，Kernighan， 
Jim Gray 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 庚 藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 l 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 电力 圳 助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指 导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ， 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专程 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 260 
个 品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 ， 
为 进一步 推广 与 发 展 打 下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 和 人 一 个 新 的 阶段 。 为 比 ， 华 章 公司 将 加 大 引进 教材 的 力度 ， 除 “计算 机 科学 丛书 ”之 
外 ， 对 影印 版 的 教材 ， 则 单独 开辟 出 “经 典 原版 书库 ”。 为 了 保证 这 两 套 丛 书 的 权威 性 ， 同 时 
也 为 了 更 好 地 为 学 校 和 老师 们 服务 ， 华 章 公司 聘请 了 中 国 科 学 院 、 北 京 大 学 、 清 华 大 学 、 
防 科技 大 学 、 复 旦 大 学 、 上 海 交通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科技 大 学 、 哈 尔 尝 工业 
大 学 、 西 安 交通 大 学 、 中 国人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮电 大 学 、 中 山大 学 、 解 放 
军 理工 大 学 、 郑 州 大 学 、 湖 北 工学 院 、 中 国 国家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科 
研 机 构 在 计算 机 的 各 个 领域 的 著名 学 者 组 成 “专家 指导 委员 会 ” ， 为 我 们 提供 选 题 意见 和 出 版 
监督 。 

这 两 套 丛 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 
的 教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. I. T.，Stanford，U.C. Berkeley, C. M. U. 等 世界 
名 牌 大 学 所 采用 。 不 仅 涵盖 了 程序 设计 、 数 据 结构 、 操 作 系 统 、 计 算 机 体系 结构 、 数 据 库 、 
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编译 原理 、 软 件 工程 、 图 形 学 、 通 信和 与 网 络 、 离 散 数学 等 国内 大 学 计算 机 专业 普遍 开设 的 核 
” 心 课 程 ， 而 且 各 具 特 色 一 有 的 出 自 语言 设计 者 之 手 、 有 的 历经 三 十 年 而 不 误 、 有 的 已 被 全 
世界 的 几 百 所 高 校 采 用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 
宫殿 中 由 登 堂 而 入 室 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服务 的 起 点 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 





电子 邮件 hzjsj@hzbook.com 

联系 电话 : (010) 68995264 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 :100037 
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种 设计 策略 。 设 计算 法 的 基本 原则 ， 也 就 是 策略 ， 显 然 比 算法 本 身 更 重要 。 本 书 利用 算法 设计 
策略 作为 指导 进行 算法 设计 ， 通 过 大 量 实例 介绍 了 设计 策略 的 基本 原理 ， 同 时 强调 了 对 每 种 算 
法 详细 的 复杂 性 分 析 。 

本 书 的 内 容 具 有 相当 的 广度 和 深度 ， 这 包括 对 各 种 策略 的 基本 机 制 、 基 础 算法 、 基 本 算法 
设计 技术 、 算 法 的 复杂 度 分 析 等 ,具体 包 括 算法 复杂 度 与 问题 的 下 界 、 贪 心 法 、 分 治 策略 、 树 
搜索 策略 、 剪 枝 搜索 、 动 态 规划 、NP 完 全 性 理论 、 近 似 算 法 、 分 摊 分 析 、 随 机 算法 和 在 线 算 
法 等 。 

本 书 的 组 织 方式 简明 扼要 、 循 序 渐进 ， 涵 盖 了 大 多 数 算法 设计 中 的 一 般 技 术 ， 同 时 包含 了 
剪 枝 搜索 、 分 摊 分 析 、 在 线 算法 以 及 多 项 式 近 似 方案 等 相对 较 新 的 思想 ， 这 些 都 是 近 20 年 来 算 
法 研究 中 发 展 迅 猛 的 领域 。 另 外 ， 对 于 两 个 重要 概念 : PTAS 和 NPO 完 全 性 做 了 清晰 的 解释 。 
对 于 在 线 算法 、 近 似 算法 、 随 机 算法 等 结合 实例 做 了 详尽 的 介绍 。 对 于 较 难 理解 的 分 摊 分 析 给 
出 了 理论 证 明 。 

算法 设计 一 直 是 备 受 关注 的 研究 领域 之 一 。 因 此 ， 本 书 还 介绍 了 算法 设计 与 分 析 领 域 的 最 
新 进展 、 最 新 成 果 和 特别 声明 ， 使 读者 能 够 容易 地 找到 进一步 研究 的 方向 。 

我 们 相信 本 书 中 译本 的 出 版 将 对 国内 高 校 计 算 机 专业 算法 课程 的 教学 起 到 积极 的 推动 作用 。 

由 于 译 者 水 平 有 限 ， 翻 译 中 难免 有 错误 和 不 妥 之 处 ， 屋 请 读者 批评 指正 。 


王卫东 
西安 电子 科技 大 学 计算 机 学 院 
2007 年 7 月 
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研究 算法 可 能 有 许多 原因 , 其 中 的 主要 原因 是 能 够 使 我 们 更 高 效 地 使 用 计算 机 。 实 践 证 明 ， 
一 位 不 具备 很 好 算法 知识 的 新 手 ， 对 于 其 老板 及 工作 单位 来 说 都 是 一 个 大 麻烦 。 假 如 某 人 要 找 ， 
一 棵 最 小 生成 树 ， 设 想 现 在 或 者 将 来 都 不 存在 计算 机 ， 那 么 他 通过 检查 所 有 可 能 的 生成 树 来 确 
定 最 小 生成 树 的 做 法 ， 对 他 来 说 也 许 足 够 好 了 。 但 是 ， 如 果 他 了 解 Prim 算 法 ， 那 么 有 一 台 IBM 
个 人 计算 机 就 足以 解决 问题 。 另 一 个 例子 是 某 人 要 解决 语音 识别 问题 ， 对 他 来 说 如 何 开始 是 相 
当 困难 的 。 但 是 ， 如 果 他 了 解 能 够 使 用 动态 规划 方法 解决 的 最 长 公共 子 序列 问题 ， 那 么 他 将 会 
明白 该 问题 是 相当 容易 解决 的 。 算 法 的 研究 不 仅 对 于 计算 机 科学 家 非常 重要 ， 而 且 通 信 工 程 师 
在 编码 时 也 要 用 到 动态 规划 或 4 算法。 有 许多 其 他 行业 的 科学 家 从 研究 算法 中 获 益 菲 线 ， 其 中 
相当 一 部 分 是 从 事 分 子 生 物 学 研究 的 科学 家 。 当 他 们 要 比较 两 个 DNA 序 列 、 两 个 蛋白 质 或 者 
三 维 结构 的 RNA 时 ， 需 要 了 解 非常 复杂 的 算法 。 

此 外 ， 研 究 算 法 也 有 很 多 乐趣 。 由 于 我 们 研究 算法 已 经 很 长 时 间 ， 因 此 在 任何 时 候 看 到 新 
的 设计 良好 的 算法 时 , 或 者 想 出 关于 设计 和 分 析 算 法 的 一 些 新 颖 想法 时 ， 都 会 异常 兴奋 。 因 此 ， 
我 们 也 感到 有 责任 让 更 多 的 人 共同 分 享 这 种 乐趣 和 兴奋 。 许 多 看 似 困难 的 问题 实际 上 可 以 通过 
多 项 式 时 间 算 法 解决 ， 而 一 些 看 似 普通 的 问题 却 被 证 实 是 NP 完 全 的 。 最 小 生成 树 问题 对 许多 
初学 者 来 说 似乎 是 相当 困难 的 ， 但 它 却 有 多 项 式 时 间 的 解决 算法 。 如 果 稍 微 对 它 改动 一 点 就 成 
为 旅行 商 问题 ， 那 么 它 就 成 为 一 个 NP 难 问题 。 另 一 个 例子 是 3 可 满足 性 问题 ， 它 是 一 个 NP 完全 
问题 。 通 过 降低 维 数 ，2 可 满足 性 问题 将 会 成 为 P 问 题 。 发 现 这 些 事 实 总 是 令 人 着 迷 的 。 

在 本 书 中 ， 我 们 将 采取 一 种 与 众 不 同 的 方法 来 介绍 算法 。 实 际 上 ， 我 们 并 不 是 在 介绍 算法 ， 
而 是 在 介绍 用 于 设计 算法 的 策略 。 原 因 很 简单 :明白 用 于 设计 算法 的 基本 原则 (也 就 是 策略 ) 
显然 比 算法 本 身 更 重要 。 尽 管 并 非 每 个 算法 都 基于 本 书 所 介绍 的 某 个 策略 ， 但 大 部 分 是 这 样 的 。 

剪 枝 搜索 、 分 摊 分 析 、 在 线 算 法 以 及 多 项 式 近 似 方案 都 是 相对 较 新 的 思想 ， 而 且 是 十 分 重要 
的 思想 。 众 多 新 开发 的 算法 都 是 基于 分 摊 分 析 的 ， 正 如 我 们 在 关于 该 主题 的 章 末 将 看 到 的 那样 。 

我 们 将 从 用 来 设计 多 项 式 时 间 算 法 的 策略 开始 介绍 。 在 必须 解决 看 似 困 难 但 目前 的 确 还 没 
有 多 项 式 时 间 算法 的 问题 时 ， 我 们 会 介绍 NP 完 全 性 的 概念 。 尽 管 经 常 很 难 把 握 它 的 物理 意义 ， 
但 应 用 NP 完 全 性 的 概念 还 是 比较 容易 的 。 实 际 上 ， 其 核心 思想 是 为 什么 每 个 NP 问 题 实 例 都 关 
联 一 个 布尔 公式 集 ， 并 且 当 且 仅 当 该 公式 集 可 满足 时 ， 该 问题 实例 的 回答 是 “yes 。 一 旦 读者 
明白 了 这 个 思想 ， 就 会 懂得 NP 完全 性 的 重要 性 。 我 们 相信 用 于 解释 这 个 思想 而 提供 的 实例 将 
会 帮助 大 多 数学 生 很 容易 地 理解 NP 完全 性 的 概念 。 

本 书 可 用 作 高 年 级 本 科 生 和 低 年 级 研究 生 的 教材 。 依 据 我 们 的 经 验 ， 如 果 在 一 个 学 期 〈 约 
50 学 时 ) 内 讲授 本 书 ， 那 么 无 法 涵盖 书 中 全 部 的 内 容 。 因 此 ， 如 果 只 有 一 个 学 期 ， 那 么 我 们 建 
议 所 有 章 都 要 讲 ， 但 不 必 都 完全 讲 透 。 不 要 忽略 任何 章 ! 关于 NP 完全 性 的 章 是 非常 重要 的 ， 
应 该 让 学 生理 解 清楚 这 章 的 内 容 。 最 难 理解 的 章 是 第 10 章 (分摊 分 析 ) ， 其 中 涉及 许多 数学 知 
识 。 教师 在 授课 时 应 当 非 常 注 意 讲 解 分 摊 分 析 的 基本 思想 ,而 不 应 过 多 地 讲述 相关 的 数学 证 明 。 
换 名 话说， 学 生 应 该 能 理解 为 什么 与 好 算法 相 结合 的 特定 数据 结构 在 分 摊 的 意义 上 执行 得 非常 
好 。 另 一 个 相对 困难 的 章 可 能 是 第 12 章 (在 线 算法 )。 





VII 


许多 算法 并 不 容易 理解 ， 我 们 将 尽量 清晰 地 介绍 这 些 算法 。 介 绍 每 个 算法 时 都 辅 以 实例 ， 
而 每 个 实例 都 利用 图 进行 解释 。 在 本 书 中 ， 提 供 了 超过 400 幅 图 来 帮助 初学 者 理解 。 

我 们 还 引用 了 关于 算法 设计 与 分 析 的 大 量 书籍 和 论文 ， 并 特别 声明 最 新 的 成 果 ， 使 读者 能 
够 容易 地 找到 进一步 研究 的 方向 。“ 参 考 文献 ”中 列 出 了 825 本 书籍 和 论文 ， 共 涉及 1095 位 作者 。 

我 们 还 会 在 适当 的 时 候 提供 实验 的 结果 。 但 作为 教师 ， 还 是 应 当 鼓 励 学 生 通 过 实现 算法 来 
给 证 结论 。 在 每 一 章 的 结尾 有 进一步 阅读 的 论文 列表 ， 鼓 励 学 生 阅读 这 些 论文 以 提升 他 们 对 算 
法 的 理解 是 非常 重要 的 。 希 望 学 生 能 领会 到 作者 不 遗 余力 地 解释 大 量 难以 理解 的 论文 是 多 么 六 
苦 ! 书 中 还 提供 一 些 用 Java 编 写 的 程序 ， 便 于 学 生 实践 。 

我 们 在 此 不 可 能 列举 出 在 准备 本 书 的 过 程 中 帮助 过 我 们 的 所 有 人 的 名 字 ， 因 为 实在 是 太 多 
了 。 但 他 们 都 属于 一 个 班 ， 是 我 们 的 学 生 或 者 同事 (许多 学 生 后 来 成 为 同事 ) 。 在 每 周 五 晚上 
的 讨论 会 上 ， 我 们 总 是 积极 活跃 地 讨论 。 这 些 讨论 指出 了 算法 研究 中 的 新 方向 ， 也 有 助 于 我 们 
决定 本 书 应 该 包含 哪些 资料 。 研 究 生 们 一 直 在 追踪 大 约 20 种 学 术 期 刊 ， 并 确保 关于 算法 的 每 篇 
重要 论文 都 存储 在 数据 库 中 ， 且 都 关联 上 关键 字 。 这 个 数据 库 对 于 写作 本 书 是 非常 有 价值 的 。 
最 后 ， 他 们 还 阅读 了 本 书 的 手稿 ， 提 出 了 批评 意见 ， 并 完成 了 实验 。 如 果 没 有 来 自 同 事 和 学 生 
们 的 帮助 ， 我 们 是 不 可 能 完成 本 书 的 。 在 这 里 ， 我 们 对 他 们 所 有 人 表示 无 限 的 感谢 。 
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BIS 4 论 


本 书 介绍 算法 的 设计 与 分 析 ， 首 先 讨论 下 面 这 个 非常 重要 的 问题 或 许 是 有 意义 的 ,为 什么 
要 研究 算法 ? 通常 认为 是 为 了 获得 高 速 的 计算 ， 但 这 只 要 一 台 高 速 计算 机 就 够 了 。 这 显然 并 不 
完全 正确 。 我 们 通过 一 个 实验 来 说 明 ， 实 验 结果 清楚 地 表明 : 在 低速 计算 机 上 执行 好 算法 比 在 
高 速 计算 机 上 执行 差 算 法 完成 得 更 好 。 考 虑 下 面 简单 描述 的 两 个 排序 算法 : 插入 排序 
(insertion sort) 和 快速 排序 (quick sort)。 

插入 排序 是 从 左 到 右 一 个 接 一 个 地 考查 数据 元 素 序列 。 在 考查 完 每 个 元 素 之 后 ， 将 元 素 插 
入 已 有 序 序列 的 一 个 适当 位 置 。 例 如 ， 假 设 将 要 排序 的 数据 元 素 序 列 是 

11, 7, 14, 1, 5, 9, 10 


对 上 面 的 数据 元 素 序列 进行 的 插入 排序 如 下 : 


有 序 序列 无 序 序列 

11 7, 14, 1, 5, 9, 10 
7, 11 14, 1, 5, 9, 10 

7, 11, 14 1, 5, 9, 10 

1, 7, 11, 14 5, 9, 10 

1, 5, 7, 11, 14 9, 10 

1, 5, 7, 9, 11, 14 10 

1, 5, 7, 9, 10, 11, 14 


在 上 面 的 排序 过 程 中 ， 考 虑 当前 有 序 序列 是 1，5，7，11，14 的 情况 ， 下 一 个 将 要 排序 的 
元 素 是 9。 先 将 9 与 14 比 较 ， 由 于 9 比 14 小 ， 接 着 将 9 与 1 比较。 必须 再 一 次 继续 比较 ， 在 将 9 与 7 
比较 之 后 ， 确 定 9 比 7 大 ， 因 此 ， 将 9 插入 到 7 和 11 之 间 。 

所 举 的 第 二 个 排序 算法 称 为 快速 排序 ， 将 在 第 2 章 中 作 详细 介绍 。 目 前 ， 只 给 出 该 算法 一 
个 较 高 层次 的 描述 。 设 想 对 下 列 数据 元 素 进 行 排序 : 

10, 5, 1, 17, 14, 8, 7, 26, 21, 3 

快速 排序 选用 第 一 个 数据 元 素 ， 也 就 是 10， 将 整个 数据 元 素 分 成 三 个 子 集合 : 一 部 分 比 10 
小 ,一 部 分 比 10 大 ， 以 及 等 于 10 的 部 分 。 这 样 将 数据 集合 表示 成 如 下 : 

(5, 1, 8, 7, 3) (10) (17, 14, 26, 21) 

现在 必须 对 下 面 两 个 子 序列 排序 

(5, 1, 8, 7, 3) 
和 (17, 14, 26, 21) 


注意 到 它们 是 可 以 各 自 独 立地 进行 排序 的 ， 划 分 的 方法 也 可 在 两 个 子 集 上 递归 地 实现 。 例 
， 考 虑 子 序列 


17, 14, 26, 21 
使 用 17 划 分 上 面 的 数据 集合 ， 可 以 得 到 
(14) (17) (26，21) 








在 将 上 面 的 序列 26，21 排 序 成 21，26 之 后 ， 可 以 得 到 
14, 17, 21, 26 
这 是 有 序 的 序列 。 
相 类 似 地 ， 
(5, 1, 8, 7, 3) 
可 排序 成 
(1, 3, 5, 7, 8) 
合并 所 有 的 有 序 序列 ， 可 以 得 到 
1, 3, 5, 7, 8, 10, 14, 17, 21, 26 
这 是 最 终 有 序 的 序列 。 


后 面 将 证 明快 速 排 序 比 插入 排序 好 得 多 。 问 题 是 ， 有 多 好 ?为 了 将 快速 排序 与 插入 排序 作 
比较 ， 我 们 在 Intel 486 上 实现 快速 排序 ， 在 IBM SP2 上 实现 插入 排序 。IBM SP2 是 超级 计算 机 ， 
在 1997 年 曾 击败 过 象棋 大 师 ， 而 Intel 486 只 是 普通 的 个 人 计算 机 。 图 1-1 提 供 了 实验 结果 ， 对 于 
每 个 点 上 的 数字 ，10 个 数据 集合 都 是 随机 产生 的 ， 并 得 到 了 两 个 算法 的 平均 时 间 。 可 以 看 到 当 
数据 元 素 少 于 400 时 ， 执 行 快速 排序 的 Intel 486 劣 于 执行 插入 排序 的 IBM SP2， 而 当 数 据 元 素 大 


于 400 时 ，intel 486 完 成 的 要 比 IBM SP2 好 得 多 。 
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图 1-1 插入 排序 与 快速 排序 性 能 比较 


上 面 的 实验 意味 着 什么 呢 ? 显然 它 表 明 一 个 重要 事实 : 在 高 速 计算 机 上 执行 低 效 算法 比 在 
低速 计算 机 上 执行 高 效 算 法 差 很 多 。 换 句 话说， 如 果 你 很 有 经 验 ， 但 没有 好 的 算法 知识 ， 那 么 


你 也 许 不 能 够 与 一 位 对 算法 非常 了 解 的 笨拙 同事 相 竞 争 。 


如 果 承 认 研 究 算法 是 重要 的 ， 就 必须 能 够 分 析 算 法 以 确定 它们 的 性 能 。 


在 第 2 章 中 ， 将 对 





绪论 了 





算法 分 析 相 关 的 一 些 基本 概念 作 简 要 介绍 。 在 本 章 中 , 对 算法 分 析 在 各 种 意义 上 都 是 介绍 性 的 ， 
在 第 2 章 末 将 介绍 一 些 优秀 的 算法 分 析 书 籍 。 

在 介绍 了 算法 分 析 的 概念 后 ， 将 注意 力 转向 问题 的 复杂 度 。 我 们 要 指出 问题 有 易 问 题 
(easy problem) 和 难 问题 (difficult problem) 之 分 。 如 果 一 个 问题 能 够 被 有 效 算法 解决 ， 多 半 
算法 具有 多 项 式 时 间 (polynomial-time) 复杂 度 ， 那 么 该 问题 称 为 易 问 题 。 反 之 ， 如 果 一 个 问 
题 不 能 够 被 任何 具有 多 项 式 时 间 的 算法 解决 ， 那 么 它 一 定 是 难 问题 。 通 常 ， 给 定 一 个 问题 ， 如 
果 已 经 知道 存在 多 项 式 时 间 内 解决 该 问题 的 算法 ， 就 可 以 确认 它 是 一 个 易 问题 。 然 而 ， 如 果 到 
目前 还 没有 发 现任 何 解 决 该 问题 的 多 项 式 时 间 算 法 ， 也 不 能 推断 在 将 来 就 找 不 到 解决 该 问题 的 
多 项 式 算法 。 幸 运 的 是 ， 有 一 种 用 于 度量 问题 复杂 度 的 NP 完 全 性 (NP-completeness) 理论 。 
如 果 一 个 问题 被 证 实 是 NP 完 全 的 (NP-complete) ， 那 么 它 被 看 作 是 个 难 问题 ， 并 且 找 到 解决 
该 问题 的 多 项 式 算 法 的 概率 是 非常 小 的 。 通 常 ，NP 完 全 性 的 概念 都 会 在 教科 书 的 末尾 才 介 绍 。 

许多 问题 看 似 不 像 是 难 问题 ， 而 事实 上 却 是 NP 完 全 问题 ， 这 是 非常 有 趣 的 。 看 下 面 一 些 
例子 。 

首先 ， 考 虑 0/1 背 包 问 题 (0/1 knapsack problem) 。 这 个 问题 非 正 式 描述 如 下 : 假如 我 们 要 
躲避 入 侵 的 军队 必须 离开 心爱 的 家 ， 随 身 携带 一 些 有 用 的 物品 。 但 是 ， 携 带 物品 的 总 重量 不 能 
超过 某 个 限制 。 在 不 超过 重量 限制 的 情况 下 ， 如 何 最 大 化 所 携带 物品 的 价值 呢 ? 例如 ， 假 设 有 
下 列 物品 : 








P, P, P, P, P; Po P, Pg 
价值 10 5 1 9 3 4 11 17 
重量 7 3 3 10 1 9 22 15 


如 果 重 量 限制 是 14， 那 么 最 好 的 解 是 选择 P|,，P,，，P; 和 P;。 该 问题 是 NP 完全 问题 ， 随 着 物 
品 的 数目 增 大 ， 很 难 找到 一 个 最 优 解 。 

另 一 个 看 似 容易 的 问题 也 是 NP 完全 问题 ， 这 就 是 旅行 商 问题 (traveling salesperson 
problem)。 为 了 直观 地 解释 该 问题 ， 考 虑 有 许多 城市 ， 勤 劳 的 推销 商 必须 遍历 每 一 座 城市 ， 每 
座 城市 不 能 遍历 两 次 并 且 要 求 遍历 路 径 最 短 。 例 如 ， 一 个 旅行 商 问题 实例 的 最 优 解 如 图 1-2 所 
示 ， 其 中 两 座 城市 间 的 距离 是 它们 的 欧 几 里 得 
距离 (Euclidean distance ) 。 

最 后 ， 考 虑 分 割 问题 (partition problem), 
即 对 于 给 定 的 整数 集合 ， 能 否 划分 这 些 整 数 为 
两 个 子 集合 5S, 和 5，， 使 得 $5, 的 和 等 于 5, 的 和 ? 
例如 ， 对 于 下 面 的 集合 

{1, 7, 10, 9, 5, 8, 3, 13} 
可 以 划分 上 面 的 集合 为 

S,={1, 10, 9, 8} 
AS, ={7, 5, 3, 13} DOSO 

图 1-2 一 个 旅行 商 问 题 实例 的 最 优 解 

可 以 验证 $S 的 和 等 于 9 的 和 。 

我 们 经 常 需要 解决 这 样 的 分 割 问题 。 例 如 ， 公 钥 加 密 方 案 就 涉及 这 样 的 问题 ， 这 至 今 仍 然 
是 一 个 NP 完 全 问题 。 

在 这 里 还 有 另 一 个 许多 读者 都 会 感 兴趣 的 问题 。 我 们 都 知道 藏 有 许多 无 价 珍宝 的 美术 陈列 馆 ， 
这 些 珍宝 是 不 能 被 偷盗 和 损坏 的 ， 所 以 在 陈列 馆 中 安排 有 警卫 。 图 1-3 显 示 了 一 个 美术 陈列 馆 。 





IE 








在 图 1-3 中 ， 如 果 在 陈列 馆 中 安排 4 名 警卫 ， 用 小 圆圈 表示 ， 陈 列 馆 的 每 面 墙 至 少 由 一 名 警 
也 监控 。 这 意味 着 整个 陈列 馆 被 这 4 名 警卫 有 效 一 
监控 。 美 术 陈 列 馆 问 题 (art gallery problem) 
是 : 给 定 一 个 多 边 形 形 状 的 陈列 馆 ， 确 定 最 少 | 
的 警卫 数 以 及 监控 整个 陈列 馆 的 警卫 所 在 的 位 O O O 
置 。 令 许多 读者 惊讶 的 是 该 问题 也 是 一 个 NP 完 


全 问题 。 
即使 意识 到 好 算法 是 最 本 质 的 这 个 事实 ， 


人 们 仍然 怀疑 研究 算法 设计 是 否 是 重要 的 ， 因 
为 好 算法 很 容易 获得 。 换 句 话说 ， 如 果 好 算法 | e 
能 够 简单 地 通过 直观 或 一 般 常识 就 可 得 到 ， 那 图 1.3 美术 陈列 馆 及 安排 的 警卫 
么 就 不 值得 费力 去 研究 算法 的 设计 。 
下 面 在 介绍 最 小 生成 树 问题 时 ， 将 会 看 到 这 个 表面 上 看 似 组 合 爆炸 的 问题 ， 实 际 上 有 非常 
简单 的 算法 能 够 高 效 解决 它 。 下 面 给 出 最 小 生 
成 树 问题 的 非 形式 化 描述 。 ° 
想象 有 许多 城市 ， 如 图 1-4 所 示 。 假 设 要 连 © 。 e 
接 所 有 城市 成 为 一 棵 生成 树 (spanning tree) 
(生成 树 是 连接 所 有 城市 而 没有 环 的 图 ) ， 使 得 
生成 树 的 总 长 度 最 小 。 例 如 ， 对 于 如 图 1-4 所 示 ° ° 
的 城市 集合 ， 其 最 小 生成 树 (minimum 
spanning tree) 如 图 1-5 所 示 。 图 1-4 说 明 最 小 生成 树 问 题 的 城市 集合 
找 出 这 样 的 最 小 生成 树 的 直观 算法 是 将 所 
有 可 能 的 生成 树 都 找 出 来 ， 并 确定 每 棵 生成 树 
的 总 长 度 。 在 穷 举 完 所 有 可 能 的 生成 树 之 后 ， 
那么 最 小 生成 树 就 得 到 了 。 因 为 可 能 的 生成 树 
数量 的 确 非常 巨大 ， 所 以 这 样 花费 的 代价 也 非 
常 大 。 已 经 证 明 对 于 n 座 城市 ， 可 能 的 生成 树 的 
Sak A fin" :。 假 如 4 = 10， 将 要 枚 举 10* 棵 树 。 
Mn = 100 时 , 这 个 数目 将 增加 到 100”(10'”%)， 图 1-5 对 于 图 1-4 所 示 城 市 集合 的 一 棵 最 小 生成 树 









































对 于 如 此 大 的 数字 ， 是 没有 计算 机 可 以 处 理 的 。 e 
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况 。 因 此 ， 必 须 找到 更 好 的 算法 。 

事实 上 ， 解 决 这 样 的 最 小 生成 树 问题 有 一 9 
个 优秀 的 算法 。 我 们 通过 举例 来 说 明 这 个 算法 。 ° 
如 图 1-6 所 示 ， 算 法 首先 找 出 di; 是 所 有 城市 间 的 3 

y ， 所 以 连 1 和 2， 如 图 1-7a 所 示 。 、 、 
iii an bb hi 5. ae an 图 1-6 说 明 一 个 有 效 的 最 小 生成 树 算法 的 例子 
市 作为 另 一 个 集合 。 找 出 两 个 城市 集合 间 的 最 短 距离 是 d2;， 连 接 城市 2 和 3。 最 后 ， 连 接 城市 3 
和 4， 整 个 过 程 如 图 1-7 所 示 。 

可 以 证 明 这 个 简单 有 效 的 算法 总 是 能 得 到 -一 个 最 优 解 ， 也 就 是 该 算法 得 到 的 生成 树 总 是 最 
小 生成 树 。 该 算法 的 正确 性 证 明 并 不 容易 ， 隐 藏 在 此 算法 之 后 的 策略 称 为 贫 心 法 (greedy 
method), 。 通 常 ， 基 于 贪心 法 的 算法 是 相当 有 效 的 。 
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遗憾 的 是 ， 许 多 类 似 于 最 小 生成 树 的 问题 却 不 能 使 用 贪心 法 解决 。 例 如 ， 旅 行商 问题 就 是 


这 样 的 。 


veo 


c) 


图 1-7 最 小 生成 树 算法 举例 


>o 


~@ 


不 易 使 用 穷 举 搜索 的 另 一 个 例子 是 1 中 心 问 题 (1-center problem)。 在 1 中 心 问 题 中 ， 给 定 


一 个 点 集合 ， 必 须 找到 一 个 覆盖 所 有 点 的 圆 ， 使 圆 的 半 
径 最 小 。 例 如 ， 图 1-8 显 示 了 一 个 1 中 心 问题 的 最 优 解 。 
对 于 该 问题 如 何 开 始 解答 呢 ? 本 书 的 后 续 章 节 将 说 明 1 
中 心 问 题 可 以 使 用 剪 枝 搜索 策 略 (prune-and-search 
strategy) 来 解决 。 - 

算法 设计 的 研究 几乎 就 是 对 策略 的 研究 。 由 于 众多 
研究 者 的 努力 ， 发 现 了 许多 优秀 的 策略 ， 这 些 策略 可 以 
用 于 设计 算法 。 我 们 不 能 断言 每 个 优秀 的 算法 一 定 是 基 
于 某 个 一 般 性 的 策略 ， 但 是 ， 可 以 明确 地 说 完备 的 策略 
知识 对 于 算法 的 研究 绝对 是 非常 重要 的 。 

现在 ， 推 荐 一 些 关 于 算法 的 书目 ， 它 们 适合 于 作为 
进一步 阅读 的 参考 。 i 

Aho, A. V., Hopcroft, J. E. and Ullman, J. D. (1974): 


图 1-8 1 中 心 问 题 的 解 
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第 2 章 算法 复杂 度 与 问题 的 下 界 


本 章 将 讨论 一 些 有 关 算 法 分 析 的 基本 问题 ， 最 主要 的 是 设法 弄 清 楚 以 下 问题 

(1) 一 些 算法 是 高 效 的 ， 而 另 一 些 却 是 低 效 的 ， 那 么 怎样 评价 一 个 算法 的 好 与 坏 呢 ? 

(2) - 些 问题 容易 解决 ， 而 另 一些 却 不 易 解决 ， 那 么 怎样 评价 一 个 问题 的 难 易 程度 呢 ? 

(3) 对 于 一 个 问题 怎样 知道 哪个 算法 是 最 优 的 ? 也 就 是 说 ， 怎 样 知 道 对 于 同样 问题 不 存在 
其 他 更 好 的 算法 呢 ? 我 们 将 要 探讨 这 些 彼此 相关 的 问题 。 


2.1 算法 的 时 间 复 杂 度 


如 果 执 行 一 个 算法 花费 较 少 的 时 间 ， 需 要 较 少 的 空间 ,那么 通常 认为 该 算法 是 好 的 。 但 是 ， 
依照 传统 ， 确 定 一 个 算法 好 坏 程度 最 重要 的 因素 是 在 执行 时 所 需要 的 时 间 。 在 本 书 中 ， 如 果 没 
有 特别 声明 ， 我 们 关心 的 是 时 间 准 则 。 

为 了 度量 一 个 算法 的 时 间 复 杂 度 (time complexity), 一 种 方法 是 为 这 个 算法 编写 一 个 程序 
看 看 程序 执行 得 有 多 快 。 但 这 种 方法 不 太 合 适 ， 因 为 有 许多 与 这 个 算法 不 相关 的 因素 影响 了 程 
序 的 执行 。 例 如 ， 编 程 人 员 的 能 力 、 所 使 用 的 语言 、 操 作 系统 ， 甚 至 特定 语言 的 编译 器 都 会 影 
响 运 行程 序 所 用 的 时 间 。 

在 算法 分 析 中 ， 总 是 选择 出 现在 算法 中 某 个 特定 的 执行 步 ， 通 过 数学 分 析 来 确定 完成 该 算 
法 所 需要 的 步 数 。 例 如 ， 在 排序 算法 中 ， 数 据 项 的 比较 是 不 可 回避 的 ， 因 此 ， 经 常用 它 来 度量 
各 种 排序 算法 的 时 间 复 杂 度 。 

当然 ， 在 一 些 排序 算法 中 ， 数 据 的 比较 并 不 是 一 个 决定 性 的 因素 ， 这 种 情况 也 是 合理 的 。 
实际 上 ， 在 某 些 排序 算法 中 ， 可 以 很 容易 举 出 这 样 的 实例 数据 的 移动 才 是 最 花费 时 间 的 。 在 
此 情况 下 ， 显 然 应 该 以 数据 的 移动 ， 而 不 是 数据 的 比较 来 度量 这 种 特定 排序 算法 的 时 间 复 杂 度 。 

通常 认为 运行 算法 的 时 间 花 费 依赖 于 问题 的 规模 (size of the problem) n, flan, £8.27 
中 定义 的 欧 几 里 得 旅行 商 问 题 (Euclidean traveling salesperson problem) 中 的 点 数 就 是 问题 的 
规模 。 正 如 所 预想 的 ， 大 多 数 算法 随 着 问题 规模 上 的 增加 ， 完 成 算法 所 需要 的 时 间 也 随 之 增加 。 

假设 执行 一 个 算 革 花费 (2 + n) 步 数 ， 通 常 认为 该 算法 的 时 间 复 杂 度 是 i* 阶 的 。 因 为 随 着 n 
的 不 断 增 加 ， 项 起 比 项 n 占 优 ， 项 n 与 项 丰 相 比较 变 得 不 很 重要 了 。 现 在 ， 以 非 正式 且 常 用 的 方 
式 给 出 表述 其 正式 且 精 确 意义 的 定义 。 

定义 当 且 仅 当 存 在 两 个 正常 数 c 和 no。， 对 于 所 有 的 n 之 n。， 使 得 [Rn)l<clg(n)l， 那 么 定义 fn) 
= O(g(n)). 

从 上 面 的 定义 ， 如果 fn) = O(g(n))， 那么 在 某 种 意义 上 ，g(n) 随 着 n 增 大 ,fn) 以 g(n) 为 界限 。 
如 果 -- 个 算法 的 时 间 复 杂 度 是 O(g(n))， 这 意味 着 对 于 某 个 常数 c<， 当 n 足 够 大 时 ， 算 法 运行 所 需 
要 的 时 间 总 是 少 于 c 倍 的 ilg(mil。 

考虑 这 样 一 种 情况 ， 完 成 一 个 算法 需要 花费 (n+ n) 步 数 ， 那 么 

f=m+n=(d+ lr) <2 对 于 n 之 1 


因此 ， 可 以 说 该 算法 的 时 间 复 杂 度 是 O(1*)， 因 为 可 以 分 别 将 c 和 no 赋值 为 2 和 1。 
接 下 来 ， 将 要 和 弄 清楚 非常 重要 的 一 点 ， 即 对 算法 时 间 复 杂 度 数量 级 阶 的 常见 误解 。 
假设 解决 同一 个 问题 的 两 个 算法 4， 和 4, 的 时 间 复杂 度 分别 为 O(n) 和 O(n)。 如 果 请 一 个 人 为 
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算法 4 和 42: 分 别 编写 两 个 程序 ， 并 在 同样 的 环境 下 运行 这 两 个 程序 ， 算 法 4: 的 程序 一 定 比 算 法 
4 的 程序 运行 得 快 吗 ? 通常 ， 错 误 地 认为 算法 4, 的 程序 将 总 是 比 算法 A 的 程序 运行 得 快 。 事 实 
上 ， 这 并 不 一 定 正确 。 一 个 简单 的 原因 是 : 在 算法 4: 中 执行 一 步 可 能 比 在 算法 4, 中 执行 一 步 花 
费 更 多 的 时 间 。 换 句 话说， 尽管 算法 4: 比 算法 4, 所 需要 的 步 数 少 ， 但 在 某 种 意义 上 ， 算 法 4 仍 
然 会 比 算法 4 运行 得 快 。 假 设 算法 4 每 一 步 所 需 的 时 间 是 算法 4 每 一 步 所 需 时 间 的 1/100， 那 么 
算法 4 和 4 的 实际 运算 时 间 分 别 是 志和 100n。 对 于 n<10, 算法 4, 比 算法 4 运行 得 快 ， 对 于 n>10， 
算法 4, 比 算法 A 运行 得 快 。 . 

现在 读者 可 能 理解 了 出 现在 函数 O(8(n) 定 义 中 常量 的 重要 性 了 ， 不 能 忽视 这 个 常量 ,但 是 
不 管 此 常数 有 多 大 ， 随 着 n 的 增加 ， 它 的 重要 性 在 逐渐 减 小 。 如 果 算 法 4, 和 A4, 的 时 间 复 杂 度 分 
别 为 Ol(g1(n)) 和 O(gs(n))， 并 且 对 于 所 有 的 x，g1(n)<g8z(n) 都 成 立 ， 那 么 随 着 n 变 得 足够 大 ， 算 法 
4, 比 算法 4A; 运行 得 快 。 

另外 应 当 铭 记 的 一 点 是 我 们 总 是 至 少 在 理论 上 能 用 硬件 来 实现 算法 。 也 就 是 说 ， 总 能 设计 
一 个 电路 来 实现 算法 。 如 果 两 个 算法 都 能 由 硬件 实现 ， 那 么 在 一 个 算法 中 执行 一 步 所 需 的 时 间 
与 另 一 个 算法 中 执行 一 步 所 需 的 时 间 相 同 。 在 此 情况 下 ， 执 行 步 数 的 量 级 显得 更 为 重要 了 。 如 
果 算 法 4, 和 4: 的 时 间 复 杂 度 分 别 是 DO02) 和 OUD)， 那 么 若 两 个 算法 都 能 完全 由 硬件 实现 ， 则 算法 4 
好 于 算法 4,。 当 然 ， 只 有 我 们 很 好 掌握 硬件 实现 算法 的 技术 时 ， 那 么 上 面 的 讨论 才 是 有 意义 的 。 

数量 级 的 意义 能 够 通过 研究 表 2-1 来 领会 。 从 表 2-1 中 ， 能 够 注意 到 如 下 的 事实 : 


表 2-1 时 间 复 杂 度 函数 







问 题 规模 : n 






有 时 间 复 杂 度 函数 








10 10° 





































log, n 3.3 6.6 13.3 
n 10 10° 10° 
niog,n 0.33 x 10° 0.7 x 10° 1.3 x 10° 
n? 10° 10° 10? 
2" 1 024 1.3 x 10” >10' 

! 3 x 10° >10'" >10" 


(1) 能 够 找 出 具有 较 低 阶 时 间 复 杂 度 的 算法 将 是 非常 有 意义 的 。 一 个 典型 的 例子 是 ， 对 于 
一 个 具有 n 个 数 的 列表 进行 顺序 查找 (sequential search)， 在 最 坏 情 况 下 需要 O(n) 次 操作 。 如 果 
对 于 一 个 n 个 数 的 有 序列 表 ， 可 以 使 用 折 半 查找 或 二 分 搜索 (binary search)。 在 最 坏 情 况 下 ， 
时 间 复 杂 度 可 以 降 到 O(log n), Mn = 104 时 ， 顺 序 查找 可 能 需要 10“ 次 操作 ， 而 折 半 查找 只 需要 
14 次 查找 。 

(2) 我 们 可 能 不 喜欢 像 它 ， 妈 等 时 间 复 杂 度 的 函数 ， 但 是 相对 于 2"， 还 是 可 以 接受 的 。 例 如 ， 
当 n = 10, n = 108， 但 是 ，2"” >10'%。 数 字 10' 是 非常 大 的 ， 以 至 于 不 管 运 行 得 多 快 的 计算 
机 ， 算 法 都 不 能 解决 该 问题 。 一 个 具有 时 间 复 杂 度 为 O(p(m)) 的 算法 ， 其 中 p(n) 是 一 个 多 项 式 函 
数 ， 称 为 多 项 式 算法 (polynomial algorithm)。 另 一 方面 ， 不 是 以 多 项 式 函 数 为 界 的 时 间 复 杂 
度 算法 称 为 指数 算法 (exponential algorithm), 

在 多 项 式 算法 与 指数 算法 之 间 有 很 大 的 不 同 。 遗 憾 的 是 很 大 一 类 指数 算法 似乎 没有 和 希望 用 
多 项 式 算 法 来 替代 。 例 如 ， 每 个 解决 欧 几 里 得 旅行 商 问题 的 算法 到 目前 为 止 都 是 指数 算法 。 类 
似 地 ， 解 决 像 8.3 节 定义 的 可 满足 性 问题 (satisfiability problem) 的 每 个 算法 到 目前 也 是 指数 算 
法 。 但 是 ， 将 会 看 到 在 3.1 节 定义 的 最 小 生成 树 问题 (minimal spanning tree problem) 是 多 项 式 
算法 可 解决 的 。 

在 上 面 的 讨论 中 ， 我 们 含糊 了 数据 的 概念 。 当 然 ， 对 于 某 些 数据 ， 一 个 算法 可 能 很 快 地 运 
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行 完 ， 而 对 于 其 他 的 数据 ， 算 法 可 能 运行 得 就 完全 不 一 样 了 。 在 下 一 节 中 将 要 讨论 这 些 主题 。 
2.2 最 好 、 平 均 和 最 坏 情 况 的 算法 分 析 


对 于 任何 算法 ， 对 其 在 三 种 情况 下 的 行为 感 兴趣 : 最 好 情况 、 平 均 情 况 和 最 坏 情况 。 通 常 ， 
对 最 好 情况 下 的 分 析 是 最 容易 的 ， 最 坏 情况 下 的 分 析 次 之 ， 而 平均 情况 下 的 分 析 是 最 难 的 。 实 
际 上 ， 一 直 都 存在 着 涉及 对 平均 情况 分 析 的 许多 开放 性 问题 。 

例 2-1 直接 插入 排序 

一 种 最 简单 的 排序 方法 是 直接 插入 排序 (straight insertion sort) 。 已 知 数字 序列 Xx/ ，x,，…， 
Xx,， 从 左 到 右 扫描 这 些 数 ， 如 果 x; 小 于 x; |!， 那 么 将 %; 放 到 x; ,的 左边 。 换 旬 话 说 ， 不 断 地 向 左 移 
动 x;:， 直 到 它 左 边 的 数 都 小 于 或 等 于 它 。 


算法 2-1 直接 插入 排序 


MA: Xi tay Ano 
输出 : x), 2, 0, CAPR PP 
For j:=2 to ndo 
Begin 
its fol 
XIX; 
While x<x; and i >0 do 
Begin 
Mig te Xi; 
i:=i-l 
End 
Xi EA 


End 


考虑 输入 序列 : 7，5，1，4，3，2，6。 直 接 揪 入 排序 得 到 的 有 序 序列 过 程 如 下 : 


7 
5, 7 
4,5, 7 
, 2, 3, 4, 5, 7 
, 2, 3, 4, 5, 6, 7 

在 分 析 中 , 将 利用 数据 移动 x := x), xa = A. = REAR SAREE E. 
在 上 面 的 算法 中 ， 有 两 层 循环 ， 外 层 循环 和 内 层 循环 。 对 于 外 层 循 环 ， 有 两 次 数据 移动 操作 总 
要 执行 ， 即 x =x Fx, , := x。 由 于 内 层 循环 可 能 执行 ， 也 可 能 不 执行 ， 用 4 表示 在 内 层 循环 中 
对 x; 执行 的 数据 移动 总 次 数 。 此 时 ， 显 然 直 接 插 和 排序 的 数据 移动 总 次 数 为 


X= Yer = an-)+ $a 
最 好 情况 : Sa =0, X=2(n—1) = O(n) 


当 输入 的 数据 已 经 有 序 时 ， 将 出 现 这 种 情况 。 
最 坏 情 况 : 当 输入 的 数据 是 逆序 时 ， 出 现 最 坏 的 情况 。 在 此 情况 下 ， 


7 
5, 
I, 
1 
1 
1 
1 
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$a = zed) 


X= (nl) + 5(n-1) = Tn D+ = O(n’) 


平均 情况 ， 考虑 元 素 x;,，(i 一 了 DD 个 数据 元 素 已 经 排 好 了 序 。 如 果 x 是 这 i 个 元 素 中 最 大 的 ， 那 
么 内 层 循环 将 不 会 执行 ， 并 和 且 在 整个 此 次 内 层 循环 中 ， 没 有 任何 数据 的 移动 。 如 果 x; 是 这 i 个 元 
素 中 第 二 大 的 ， 在 内 层 循环 中 ， 将 移动 一 个 数据 ， 以 此 类 推 。x; 是 最 大 元 素 的 概率 是 1/i， 对 于 
1<j<i， 这 也 是 x 是 第 /大 元 素 的 概率 。 因 此 ，(2 + 四 的 平均 是 
2 3 i+1 wt) i+3 
Tr 


直接 插入 排序 的 平均 时 间 复 杂 度 是 


pits {ded J= —(n-1)(n+8) = O(n’) 


总 之 ,在 各 种 情况 下 ， 直 接 插入 排序 的 时 间 复 杂 度 分 别 如 下 : 

最 好 情况 : 2(n 一 1) = O(n) 

平均 情况 : (n+ 8)(n 一 1)/4 = O(n’) 

BER: (n—1)(n + 4)/2 = OV) 

例 2-2 折 半 查找 算法 

折 半 查找 (binary search) 是 一 个 有 名 的 查找 算法 。 在 将 一 个 数据 集 排序 为 递增 或 递 碱 有 序 
后 ， 折 半 查 找 从 序列 的 中 间 开 始 。 如 果 查 找 的 数据 等 于 序列 中 间 位 置 的 数据 ， 那 么 查找 终止 ， 否 
则 ， 依 据 查找 数据 与 中 间 位 置 数据 比较 的 结果 ， 可 以 递归 地 查找 序列 的 左 半 部 分 或 者 右 半 部 分 。 


算法 2-2 折 半 查找 


WA: 有 序数 组 a/，ay，…，a,，n>0, X, pa sasas <a,, 
输出 ;如果 = X， 那 么 输出 /， 如 果 不 存 在 /使 w = X， 那 么 输出 0。 
i:= 1  (* 第 一 个 数据 *) 
mi=n (* 最 后 一 个 数据 *) 
While i<m do 
Begin 


， i+m 
j= _ 
[3 





If X = a, then output j and stop 
If X< a then m: =j~l 
else i:=j+ 1 

End 

j:=0 

Output j 


0 
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对 折 半 查找 最 好 情况 下 的 分 析 是 相当 简单 的 。 在 最 好 的 情况 下 ， 折 半 查 找 只 需要 一 步 就 完 
成 了 。 

最 坏 情况 下 的 分 析 也 是 相当 简单 的 。 很 容易 看 出 来 最 多 需要 (|log: 2] +) 步 数 就 能 完成 折 
半 查 找 。 贯 穿 于 本 书 的 剩余 部 分 ， 除 非 有 特别 声明 ，log n 就 是 指 log>n。 

为 了 简化 讨论 ， 假 设 n = 2 一 !。 

对 于 平均 情况 下 的 分 析 ， 如 果 有 n 个 元 素 ， 那 么 对 于 该 算法 有 一 个 元 素 仅 需 一 步 就 能 使 算法 


成 功 地 终止 ， 该 元 素 位 于 有 序 序列 的 第 | -2 





个 位 置 。 有 两 个 元 素 只 需要 二 步 就 能 使 算法 成 功 


地 终止 。 一 般 来 说 ， 对 于 ! = 1，2，…，|ilog 可 +1， 会 有 2” 个 元 素 在 ! 步 之 后 使 算法 成 功 地 终 
止 。 如 果 X 不 在 序列 中 ， 那 么 算法 在 执行 完 [logn]+1 步 后 失败 地 终止 。 总 的 来 说 ， 可 以 说 有 
(mn + 1) 种 不 同 的 情况 ， 有 n 种 情况 能 使 折 半 算法 成 功 结束 ， 另 有 (n + D 种 情况 能 使 折 半 算法 查 
找 失败 结束 。 

令 A(n) 表 示 在 折 半 查找 中 平均 的 比较 次 数 ， 并 且 k= [logn|+1, AA 


l : ‘ni-l 
A(n) = mil}? k(n) 








现在 要 证 明 


k 
yi" = 2'(k-1) +1 (2-1) 


i= 


上 面 的 公式 可 以 通过 对 k 进 行 归纳 来 证 明 。 当 k = 1 时 ， 等 式 (2-D) 显 然 是 成 立 的 。 假 设 当 k = 
m，m>>1 时 ， 等 式 (2-1) 是 成 立 的 。 然 后 ,证 明 在 k =m + 1 时 ， 等 式 (2-1) 也 是 成 立 的 。 即 假设 等 
式 (2-D) 是 成 立 的， 证 明 


mei 
di" =2"*'"(m+ 1-1) +1=2"*'- m+ 


Ha 


Sr = yi" +(m+1)2""" 
将 等 式 (2-1) 代 入 上 面 的 公式 ， 得 到 
Sin = 2"(m—-1) + 1+ (m+ 1)2"=2" 2m+ 1 =2"*'- m4) 
至 此 ， 我 们 已 经 证 明了 等 式 (2-1) 的 有 效 性 ， 使 用 等 式 (2-1) 得 到 
A(n) = ke D2 +14+k2‘) 
当 n 非 常 大 时 ， 可 以 得 到 


A(n 





eS 1 
2 


二 = 天- 
2 
所 以 ，4(0D<K= O(log n), 
现在 ， 读者 可 能 想 知道 通过 假设 = 2: 一 1 得 到 的 结果 对 于 一 般 的 n 是 否 有 效 。 假 如 1(n) 是 一 
个 非 递减 函数 ， 并 且 i1(n) = OG (n)) 是 通过 假设 a = 2 一 1 时 得 到 的 算法 的 时 间 复 杂 度 ， 同 时 对 于 
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某 个 b 之 1 且 c' 是 一 个 常数 ，f (bn) <cAhn) 成 并 (这 意味 着 f 是 一 个 平滑 函数 ， 而 每 个 多 项 式 函 数 
都 是 这 样 的 函数 )。 那 么 
129 <cf (24), 其 中 c 是 一 个 常数 。 
HFO<x<1, Sn'=2'"? 
(n) = AZ *") < (25 *3) icf (2** y= of (24+ w. Qh Y<ce'f (2'*") =c"f(n') 


Alt, tn) = OF n). 

上 面 的 讨论 表明 可 以 假设 a = 2 一 1 得 到 算法 的 时 间 复 杂 度 。 在 本 书后 面 的 章节 中 ， 必 要 时 
将 假设 n = 2 一 1， 而 不 再 解释 为 什么 可 以 这 样 了 。 

总 之 ， 对 于 折 半 查找 ， 可 以 得 到 

最 好 情况 : OC) 

平均 情况 : O(log n) 

最 坏 情 况 : O(log n) 

例 2-3 ”直接 选择 排序 

直接 选择 排序 (straight selection sort) 也 许 是 最 简单 的 一 类 排序 ， 然 而 对 这 种 算法 的 分 析 
却 相当 有 趣 。 直 接 选 择 排 序 可 以 很 容易 地 描述 如 下 : 

(1) 找 出 最 小 的 数 ， 把 这 个 最 小 的 数 与 a 交换 ， 放 在 a 的 位 置 。 

(2) 对 余下 的 数 ， 重 复 上 面 的 步骤 。 也 就 是 ， 找 到 第 二 小 的 数 ， 放 在 a, 交 换 。 

(3) 继续 这 个 过 程 ， 直 至 找到 最 大 的 数 。 


算法 2-3 直接 选择 排序 


输入 : ais az, Ayo 
输出 : a/，a,，…， wa 的 有 序 序列 。 
For j: = 1ton 一 1 do 
Begin 
fi 
For k :=j + l ton do 
If a,<a, then f := k 
aj e a; 


End 





在 上 面 的 算法 中 ， 为 了 找 出 a1/，a;，…，a, 中 的 最 小 数 ， 必 需 设置 一 个 标记 f ， 并 且 初 始 化 
f= 1， 然 后 比较 a 与 4;。 如 果 aj <a,， 那 么 不 需要 做 任何 事 ， 否 则 ， 和 置 f = 2， 再 比较 aj 与 a3;， 依 
此 类 推 。 

很 明显 ， 在 一 个 直接 选择 排序 中 有 两 种 操作 : 两 个 元 素 的 比较 与 标记 的 改变 。 两 个 元 素 进 
行 比 较 的 次 数 是 一 个 固定 数 ， 即 n(n 一 1)2。 也 就 是 ， 不 论 输入 什么 数据 ， 总 要 进行 x(n 一 1)/2 次 
比较 。 因 此 ， 选 择 标 记 的 改变 次 数 来 度量 直接 选择 排序 的 时 间 复 杂 度 。 

标记 的 改变 依赖 于 数据 。n = 2 时 ， 只 有 两 个 排列 : 

(1, 2) 

和 (2, 1). 

对 于 第 一 个 排列 ， 标 记 不 需要 改变 ， 而 对 第 二 个 排列 ， 标 记 必 须 改 变 。 

令 f (a1，qs，…，q) 表 示 在 序列 4a/，4,，…，a, 中 找 出 最 小 数 而 标记 需要 改变 的 次 数 。 下 表 
说 明了 n= 3 的 情况 。 
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dis a2, a, f(a, a, a) 
1, 2, 3 0 
l, 3, 2 0 
2, ] ， 3 1 
2， 3, 1 1 
3， l, 2 l 
3, 2, l 2 


HTS, a, e, a), PAPER: 

(1) 如 果 a, =1, Afa, an e, a= ltf, any o a), HAER eA 
定 改变 。 

(2) 如 果 a, 了 1， 那么 f (ay，42，…，a) = 了 f(a，42，…，41)， 因 为 在 最 后 一 步 标记 不 必 改 变 。 

令 P,(D 表 示 {，2，…， 双 的 一 个 排列 a/，42，…，a,， 找 到 最 小 数 需要 改变 kK 次 标记 。 例 
如 ，P:(0) = 2/6，P;(1) = 3/6 以 及 P;(2) = 116， 那 么 ， 为 找到 最 小 的 数 而 需要 改变 标记 的 平均 次 
数 为 


nl 


X= $ KPE) 


那么 ， 直 接 选 择 排 序 标记 改变 的 平均 次 数 为 
A(n) = X, + A(n—1) 
为 了 确定 X,， 下 面 用 到 之 前 讨论 过 的 等 式 : 
Fe ,0) = 1+f(a， 0， apa) 如 果 a,=1 
=f(ai, a3, ©, api) 如 果 a, 去 1 
依据 上 面 的 公式 ， 可 以 得 到 
P (k) = Pla, = 1)P,_ (Kk—1) + Pla, # 1)P„-1(k) 
mPa, = DD) = Un，P(a,x1) = (一 D。 因 此 ， 可 以 得 到 


Pk) = LP (k-1)+ EP (k) (2-2) 
n n 


此 外 ， 得 到 下 面具 有 初始 条 件 的 公式 : 
Pi(P = 1， 才 k=0， 
=0, #k#0, (2-3) 
Pky =0, #0, FHA Bk an 
为 了 使 读者 对 公式 有 更 进一步 的 认识 ， 现 在 注释 如 下 : 


l 
PO) = = 
及 P(D= 4 
; 2 
1 2 1 2 1 1 
PO) = 3RCD+3RBO)- 3*0+3*7-3 
l 2 1 1 2 1 
RPD) = BCOD+3SRC)-3x7t+3x0-6。 


接 下 来 ， 要 证 明 ， 
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n-i 


X,= OEE +5 = H,—1 (2-4) 


其 中 五 是 第 n 个 调和 数 (Harmonic number), 
采用 数学 归纳 法 证 明 等 式 (2-4)， 也 就 是 要 证 明 


对 于 n = 2 很 明显 是 成 立 的 。 假 设 对 于 n = m，m>2 时 等 式 (2-4) 是 成 立 的。 现在 要 证 明 等 式 
(2-4) 对 于 n =m + 1 也 是 成 立 的 。 因 此 ， 要 证 明 
Xma 1 一 Ans 1 一 


Xin 1 三 DPn O = Pns (1) + QP ins 1(2) 十 … 十 mpP, + (m) 


利用 等 式 (2-2)， 可 以 得 到 



































Xna = 一 P+ D+ + 2m 2) 二 pm) 
m+ 
=! —~ P,(0) + D+ Pa + — Pl) + Pa) + PO 
m+ 
L POPOP, — P, om-1) 
tma 
= (PO) + P+ +P (m- N+ Pal) 
m+ 
"Om Dnt 
m+l m+l 
= | T+ (B,D +2P, +t 0n- DP, (m- D) 
m+l 
= 一 +H,-1 (由 递归 假设 ) 
m+l 
= meio 
既然 直接 选择 排序 的 平均 时 间 复 杂 度 是 : 
A(n) = X, + A(n—1) 
可 以 得 到 
A(n) = H,-1 + A(n—1) = (H,—1) + (H,—1) + + (H,—1) 
- $a -0-) (2-5) 





= fyt} (py ll 工 
H, +\ Hy nl + ” n n-l 2) 
-1 n-2 1\ 
= nH _ (2 一 十 … 十 一 
mu \ a ta- 2) 








18 #2 
= nH, -人 -上 
\ a n-i 2) 
1 1 i 
= nH 人 meee 一 
"A n n-l 2) 
=nH,-n+H, 
=(n+ 1)H,—n 
因此 
yi =(n+ H, -H =n (2-6) 


将 等 式 (2-6) 代 入 等 式 (2-5) 中 ， 可 以 得 到 
A(n) = (n+ DH,—H-n—1)-—n= (n+ DH,—2n 
当 n 是 够 大 时 ， 
A(n) ~n log, n = O(n log n) 

直接 选择 排序 的 时 间 复 杂 度 总 结 如 下 : 

最 好 情况 ，0(1) 

平均 情况 : O(n log n) 

最 坏 情 况 : O(n’) 

例 2-4 快速 排序 

快速 排序 (quick sort) 基于 分 治 策略 (divide-and-conquer strategy), ， 后 面 将 详细 地 说 明 分 
治 策略 。 在 此 ， 简 单 地 说 分 治 策略 是 将 一 个 问题 划分 成 两 个 子 问题 ， 再 分 别 各 自 独立 地 解决 这 
两 个 子 问题 ， 随 后 ， 将 结果 合并 成 最 终 的 解 。 将 分 治 策略 应 用 于 排序 ， 得 到 一 个 称 为 快速 排序 
的 排序 方法 。 已 知 数 的 集合 a1/，a,，…，a,， 选 择 一 个 元 素 X 将 4a,，a,，…，a, 划 分 为 两 个 序列 ， 
如 图 2-1 所 示 。 


< 一 快速 排序 
Li <X 
Ly >X |。 一 快速 排序 
图 2-1 快速 排序 


在 划分 之 后 ， 分 别 对 L, 和 二 递归 地 应 用 快速 排序 ， 因 为 L 中 所 有 的 a; ADP ae EX, Mil 
中 所 有 的 a; 都 大 于 XX， 所 以 结果 序列 是 一 个 有 序 序列 。 

这 里 的 问题 是 : 如 何 划分 序列 ? 当然 不 必用 X 来 扫描 整个 序列 , 以 确定 a; 是 小 于 还 是 等 于 X， 
这 会 引起 大 量 的 数据 移动 。 正 如 在 算法 中 说 明 的 ， 可 使 用 两 个 指针 ， 向 中 间 移 动 它们 ， 在 必要 
时 ， 进 行 数据 交换 。 


FAZER A PAA FR 19 











算法 2-4 Quicksort(f ,1) 


输入 : Gps ditis “+ Gjo 
输出 : w ，w，，…，w 的 有 序 序列 。 
If f > 1 then Return 
X:=a, 
i:=f 
jal 
While i<j do 
Begin 
While a,>X do 
j:=j-l 
asa, 
While a; < X do 
i:=i+] 


End 
Quicksort(f , j-1) 
Quicksort(j +1, J 








下 面 的 例子 说 明了 快速 排序 的 主要 思想 ， 


X=3 a, ay, a; a4 as A 
aj = ASX 3 6 1 4 5 2 
ti ti 
2 6 1 4 5 3 
ti ti 
a; = a,>X 2 6 1 4 5 3 
ti tj 
2 3 1 4 5 6 
ti ti 
2 3 1 4 5 6 
ti tj 
2 3 1 4 5 6 
ti tj 
a;=a;<X 2 3 l 4 5 6 
ti tj 
2 1 3 4 5 6 
fi ti 
2 1 3 4 5 6 
itty 
I+ <3 =3 | 23-1 


当 X 正 好 在 中 间 位 置 将 序列 划分 成 两 个 子 序列 ， 此 时 快速 排序 呈现 出 最 好 的 情况 。 换 句 话 
说 ，X 划 分 出 两 个 包含 相同 数目 元 素 的 子 序列 。 在 这 种 情况 下 ， 第 一 趟 循环 需要 ” 步 将 序列 划分 
成 两 个 子 序列 。 在 下 一 - 趟 循环 ， 对 每 一 个 子 序列 都 再 需要 m2 步 〈 忽 略 用 来 划分 的 元 素 )。 因 此 ， 
对 第 二 趟 ， 又 需要 2 . (n/2) = nH, Bit = 2， 那 么 总 共 需 要 pn 步 。 而 p = logzn。 因 此 ， 在 最 
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好 情况 下 ， 快 速 排序 的 时 间 复 杂 度 是 O(n log n)。 

当 输 入 的 数据 是 正 序 或 逆序 上 时， 快速 排序 将 出 现 最 坏 情 况 。 在 这 种 情况 下 ， 选 择 的 只 是 极 
值 元 素 (最 大 或 最 小 元 素 )。 因 此 ， 快 速 排序 在 最 坏 情况 下 所 需要 的 总 步 数 是 

n+ (nD)+ +l= sine) = O(n’) 

为 了 分 析 平 均 情 况 ， 令 T(n) 表 示 在 平均 情况 下 对 a 个 元 素 执 行 快速 排序 所 需要 的 步 数 。 假 
如 在 划分 操作 之 后 ， 序 列 划分 成 两 个 子 序 列 ， 第 一 个 子 序 列 包 含 * 个 元 素 ， 第 二 个 子 序列 包含 
(n 一 s) 个 元 素 ，s 的 取 值 范围 从 1 到 n。 为 了 分 析 平 均 情 况 下 的 性 能 ， 需 要 考虑 所 有 可 能 的 情况 。 
下 面 的 公式 用 于 得 到 Tl(n): 

T(n) = Ave(T(s) +7T(n-s))+en 
其 中 cn 表示 在 第 一 次 划分 中 所 需要 的 操作 次 数 (注意 在 划分 成 两 个 子 序列 前 ， 需 要 扫描 每 个 元 
素 。) 
Ave(T(s) +T(n-5s)) 


FS TOT- 


lro +T(n—-1)+T(2)4+T(n-2)4---+T(n) +T(0)) 

n 

KATO) = 0, 

T(n) = Larm +2T(2)+:…+2T(n-1)+T(nD+cen 
n 


或 者 ，(n 一 DT(n) = 27(1) + 27(2) + … + 2T(n—1) + cn’, 
用 n = n 一 1 带 入 上 面 的 公式 ， 得 到 
(n—2)T(n—1) = 27(1) + 27(2) + = + 2T(n—2) + c(n-1y 





所 以 ， 
(n—1)T(n)—(n—2)T(n—1) = 2T(n—1) + c(2n—1) 
(n—1)T(n)—nT(n— 1) = c(2n—-1) 
Tan) - Ta-D fl, \ 
n n-l \n n-1) 
递归 地 ， 
Ta-) - Tc-2 1 L 
n-| n-2 \n-1 n-2) 
T2)_ TO, (l,l 
2 1 \2 1) 
可 以 得 到 


T ft, DN 
n Vn nel t Anai n2" +1 


= c(H, — 1) + cH, 
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=c(H,+ H,- 1) 
-= oH -4-1 
= co, 1 
_ con "+l) 
所 n } 


最 终 ， 可 以 得 到 
T(n) = 2cnH,—c(n + 1) 
=2cn log.n—c(n + 1) 
= O(n log n) 
总 之 ， 快 速 排序 的 时 间 复 杂 度 分 别 是 
最 好 情况 : O(n logn) 
平均 情况 : O(n log n) 
最 坏 情 况 : O(n’) 
例 2-5 确定 秩 问题 
设 有 一 组 数 a;/，a;，…，a, 的 集合 。 如 果 a; >a)， 那 么 认为 a; 支 配 (dominate) aj。 如 果 要 找 
出 & 支 配 a 的 总 次 数 ， 可 以 简单 地 将 这 些 数 排 成 一 个 序列 ， 该 问题 可 以 很 快 地 解决 。 
现在 将 问题 扩展 至 2 维 的 情况 ， 也 就 是 ， 每 个 数据 是 平面 上 的 一 个 点 。 在 这 种 情况 下 ， 首 
先 定 义 在 2 维 空间 中 点 的 支配 含义 。 
定义 已 知 两 个 点 4 = (a1，ay) 和 B=(b|，b2)， 对 于 i = 1，2， 当 且 仅 当 a; >b, MAAR 
配 B。 如 果 A 不 支配 B，B 也 不 支配 和 A， 那么 人 4 和 B 是 不 可 比 的 。 
考虑 图 2-2。 





图 2-2 说 明 支 配 关系 的 示例 


对 于 图 2-2 中 的 点 ， 可 以 得 到 如 下 的 关系 : 

(1) B、C 和 DD 支配 A。 

(2) DÆMA, BHC, 

(3) 所 有 其 他 的 点 对 都 是 不 可 比 的 。 

在 定义 了 支配 关系 后 ， 可 进一步 可 定义 点 秩 (rank of a point) 的 概念 。 
定义 ”已 知 A 个 点 的 集合 5， 点 X 的 秩 定 义 为 由 X 支 配 的 点 个 数 。 
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对 于 图 2-2 上 的 点 ， 点 4 和 E 的 秩 是 90， 内 为 它们 不 支配 任何 点 。 点 8 和 C 的 秩 是 1， 因 为 只 
点 4 被 它们 所 支配 ， 点 已 的 秩 是 3， 因 为 点 4、8 和 C 都 被 点 忆 所 支配 。 

我 们 的 问题 是 找 出 每 个 点 的 秩 。 

解决 该 问题 的 直接 方法 是 对 全 部 的 点 对 进行 穷 举 的 比较 。 这 种 方法 的 时 间 复 杂 度 是 O(n )。 
卜 面 将 证 明 在 最 坏 情况 下 可 用 O(n log 刀 时 间 解 决 该 问题 。 

考虑 图 2-3， 第 - 步 找 出 一 条 垂直 于 x 轴 的 直线 1， 该 直线 将 点 集 划分 成 点 数 相 等 的 两 个 子 
集 。 令 4 表示 在 直线 上 左边 的 子 集 ，B 表 示 在 直线 二 右边 的 子 集 。 显 然 ，4 中 任何 点 的 秩 不 受 B 存 
在 的 影响 ， 但 是 8 中 点 的 秩 可 能 受 A 存 在 的 影响 。 








图 2-3 解决 秩 问 题 的 第 一 步 


假设 分 别 找 出 了 A 和 8 中 点 的 局 部 秩 (local rank)， 也 就 是 ， 找 出 了 4 中 点 的 秩 (不 考虑 B) 
和 8B 中 点 的 秩 (不 考虑 4)。 现 在 给 出 在 图 2-3 和 图 2-4 中 点 的 局 部 秩 。 








图 2-4 在 4 和 8 中 点 的 局 部 秩 


现在 将 全 部 的 点 投影 在 直线 上 上 。 注 意 ，B5 中 的 点 已 支配 4 中 的 点 己 ， 当 且 仅 当 点 已 的 > 值 比 
点 P; 的 y 值 高 。 令 P 是 8 中 的 一 点 ， 点 P 的 秩 是 8 中 点 P 的 秩 加 上 A 中 点 的 y 值 小 于 P 的 y 值 的 点 数 。 
点 秩 的 更 新 结果 如 图 2-5 所 示 。 
接 下 来 的 算法 确定 了 平面 上 每 个 点 的 秩 。 
算法 2-5 确定 秩 的 算法 


输入 : 平面 点 P,， Phyo, PRESS, 
输出 :集合 S 中 每 个 点 的 秩 。 
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步骤 1 如 果 $ 只 有 一 个 点 ， 那 么 返回 该 点 的 秩 为 0 否则， 选择 垂直 十 X 轴 的 直线 上 L， 使 得 S 中 必 2 个 点 的 x* 值 比 忆 
小 《 称 这 个 点 集 为 4)， 其 余 点 的 x 值 比 L 大 〔 称 这 个 点 集 为 8) ， 注 意 L 是 这 组 点 的 x 值 的 中 值 。 

步骤 2 递 丰 地 使 用 这 个 确定 点 秩 的 算 甘 找 出 集合 4 中 点 的 秩 和 集合 8 中 点 的 秩 。 

步骤 3 依据 y 值 对 集合 4 和 8 中 的 点 进行 排序 ， 顺 序 扫描 这 些 点 ， 对 8 中 的 每 一 个 点 确定 4 中 点 的 ?> 值 小 于 该 点 的 
数量 ， 那 么 该 点 的 秩 就 是 6 中 这 个 点 秩 〈 步 骤 2 找 出 的 ) ， 加 上 4 中 点 的 y 值 小 于 其 ? 值 的 点 数量 。 





图 2-5 秩 的 更 新 


算法 2-5 是 一 个 递归 算法 。 它 基于 分 治 策略 ， 将 一 个 问题 分 成 两 个 子 问题 ， 分 别 独立 地 解 
决 这 两 个 子 问题 ， 然 后 将 两 个 子 问题 的 解 合并 成 该 问题 的 最 终 解 。 这 个 算法 的 时 间 复 杂 度 依赖 
于 下 列 步骤 的 时 间 复 杂 度 。 
(1) 在 步骤 1 中 ， 有 一 个 找 出 一 组 数 的 中 值 操作 ， 在 第 7 章 中 将 证 明 任何 中 值 查找 算法 的 最 
小 时 间 复 杂 度 为 O(n)。 
(2) 在 步骤 3 中 ， 有 一 个 排序 操作 ， 在 2.3 节 ， 将 证 明 任何 排序 算法 的 最 小 时 间 复 杂 度 为 
O(nlogn), HEROM. 
令 TUo) 表 示 完 成 秩 的 查找 算法 的 总 时 间 。 那 么 
T(n) <27(n/2) + cın log n+ cn <2T(n/2) + cn log 天 
其 中 c,、cz 和 c 为 常数 。 令 n= 2?， 那 么 
T(n)<2T(n/2) + cn logn 
<2(2T(n/4) + cn log(n/2)/2) + cn log n 
= 47(n/4) + c(n log (n/2) + n log n) 


<nT(1) + c(n log n + n log (n/2) + n log (n/4) +: +n log 2) 





1 
=nT(1)+ on( +e" togn) 


= cn+<nlog?n+<nlogn 
2 "2 


因此 ，T(n) = O(n log’n). 

上 面 的 时 间 复 杂 度 既是 对 最 坏 情况 也 是 对 平均 情况 的 分 析 ， 因 为 对 于 排序 的 最 小 时 间 复 杂 
度 O(n log n) 对 于 平均 情况 也 是 有 效 的 。 类 似 地 ， 查找 中 值 的 时 间 复 杂 度 O(n) 对 于 平均 情况 也 
是 有 效 的 。 

注意 ， 这 个 查找 每 个 点 秩 的 算法 比 使 用 穷 举 测试 算法 好 得 多 。 如 果 要 实施 穷 举 全 部 点 对 的 
扫描 ,需要 0O(m) 步 来 完成 整个 过 程 。 





24 £$2¢ 
2.3 问题 的 下 界 


在 前 -- 节 ， 许 多 确定 算法 时 间 复 杂 度 的 例子 让 我 们 知道 怎样 判断 一 个 算 靶 好 。 本 节 将 从 完 
全 不 同 的 角度 考虑 复杂 度 问题 。 

考虑 确定 点 秩 的 问题 ， 或 者 旅行 商 问 题 ， 现 在 要 问 ， 如 何 度量 一 个 问题 的 困难 度 ? 

上 面 的 问题 可 以 直观 地 回答 。 如 果 问 题 可 由 一 个 具有 较 低 时 间 复 杂 度 的 算法 解决 ， 那 么 该 
问题 是 简单 的 问题 ， 否 则 ， 该 问题 是 困难 的 问题 。 这 个 直观 的 定义 导出 了 问题 下 界 (lower 
bound of a problem) 的 概念 。 

定义 ”一 个 问题 的 下 界 是 用 来 解决 该 问题 的 任意 算法 所 需要 的 最 小 时 间 复 杂 度 。 

为 了 描述 下 界 ， 使 用 记号 2， 它 的 定义 如 下 : 

定义 当 且 仅 当 存在 正 的 常数 c 和 no， 对 于 所 有 的 n>no， 都 有 |(n)|>clg(n)| 成 立 ， 那 么 

F(a) = Q(e{n)) 

尽管 可 以 使 用 平均 情况 时 间 复 杂 度 (average-case time complexity), ， 但 上 面 的 定义 通常 是 
站 最 坏 情 况 时 间 复 杂 度 (worst-case time complexity)。 如 果 使 用 平均 情况 时 间 复 杂 度 ， 那 么 下 
界 称 为 平均 情况 下 界 (average-case lower bound) ; 否则， 称 为 最 坏 情 况 下 界 (worst -case 
lower bound)。 在 本 书 中 ， 除 非 有 其 他 的 声明 ， 提 到 下 界 都 是 指 最 坏 情况 下 界 。 

从 上 面 的 定义 中 ， 似 乎 必须 要 枚 举 所 有 可 能 的 算法 ， 来 确定 每 个 算法 的 时 间 复 杂 度 ， 才 能 
找 出 最 小 的 时 间 复 杂 度 。 这 当然 是 不 可 能 的 ， 因 为 不 可 能 简单 地 枚 举 出 所 有 可 能 的 算法 ， 而 且 
也 不 能 肯定 将 来 是 否 能 发 明 出 一 种 新 的 算法 ， 它 得 到 更 好 的 界 。 

读者 应 该 注意 到 ， 定 义 的 下 界 不 是 唯一 的 。 一 个 熟知 的 下 界 例子 是 排序 的 下 界 ， 它 是 
Q(n log n)。 想 象 在 这 个 下 界 找 出 之 前 ， 也 许 证 明了 排序 的 下 界 是 Q(n)， 因 为 在 完成 排序 之 前 ， 
每 一 个 数据 元 素 都 要 检验 。 事 实 上 ， 其 至 可 以 更 极端 。 例如， 在 Q&(n) 被 看 作 是 排序 的 下 界 之 前 ， 
有 人 可 能 将 Q(1) 作 为 一 个 下 界 ， 因 为 算法 最 少 只 需要 一 步 就 可 以 完成 任何 排序 算法 。 

从 上 面 的 讨论 中 知道 ， 对 于 排序 可 能 存在 三 个 下 界 ，Q&(n logn), QUAM), CRE 
正确 的 。 但 是 ， 很 明显 Q(n log nn) 是 唯一 有 意义 的 ， 另 外 两 个 是 不 重要 的 下 界 。 既 然 下 界 太 低 ， 
就 是 不 重要 的 ， 那么 就 希望 下 界 尽 可 能 得 高 。 下 界 的 研究 总 是 以 科学 家 建议 有 较 低 下 界 开始 的 ， 
然后 ， 通 过 找到 更 高 的 下 界 来 提高 下 界 。 问 题 的 更 高 下 界 代替 原来 的 下 界 成 为 该 问题 当前 有 意 
义 的 下 界 。 这 种 情况 一 直 持续 到 找 出 另 一 个 更 高 的 下 界 。 

我 们 必须 明白 每 个 更 高 下 界 的 找 出 都 是 通过 理论 分 析 得 到 的 ， 而 不 是 纯粹 的 猜测 。 由 于 找 
出 的 下 界 不 断 地 提高 ， 不 可 避免 地 想 知道 是 否 存在 下 界 的 上 限 ? 例如 ， 考 虑 排序 的 下 界 ， 是 否 
有 可 能 将 Q(n”) 看 作 是 排序 的 下 界 妮 ? 不 能 ， 因 为 存在 一 个 称 为 堆 排序 的 算法 ， 它 的 最 坏 情 况 
时 间 复 杂 度 是 Qn log n)。 因 此 ， 知 道 排序 的 下 界 至 多 是 Qn log x), 

现在 考虑 下 面 的 两 种 情况 : 

情况 1， 目 前 ， 一 个 问题 被 找 出 的 最 高 下 界 是 Q(n log n)， 而 解决 这 个 问题 的 最 可 行 算法 的 
iY Ta) Ae RE Qn’), 

在 这 种 情况 下 ， 有 三 种 可 能 性 : 

0) 问题 的 下 界 太 低 ， 因 此 ， 我 们 尽 可 能 地 寻找 一 个 更 有 力 的 或 更 高 的 下 界 。 换 名 话说， 
应 该 尽 可 能 地 提高 下 界 。 

(2) 最 可 行 的 算法 不 够 好 。 因 此 ， 尽 可 能 地 找 出 一 个 更 好 的 具有 较 低 时 间 复 杂 度 的 算法 。 
换 句 话说 ， 应 该 向 下 改进 最 好 的 时 间 复杂 度 。 

(3) 下 界 可 能 被 提高 ， 算 法 也 可 能 被 改善 ， 因 此 ， 应 该 尽力 提高 这 两 个 方面 。 

情况 2: 当前 的 下 界 为 Q(n log n)， 确 实 存 在 一 个 时 间 复 杂 度 为 &(n log ny) HIRE. 
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在 这 种 情况 下 ， 我 们 明白 下 界 与 算法 都 不 能 进一步 提高 了 。 换 名 话说， 已 经 找到 了 一 个 解 
决 该 问题 的 最 优 算法 和 真正 有 意义 的 下 界 。 

需要 强调 上 面 的 这 一 点 。 在 本 章 的 开始 曾 提出 了 一 个 问题 : 如 何 知道 一 个 算法 是 最 优 的 ? 
现在 有 了 答案 : 如 果 一 个 算法 的 时 间 复 杂 度 等 于 这 个 问题 的 下 界 ， 那 么 该 算法 是 最 优 的 。 因 此 
下 界 和 算法 都 不 能 再 进一步 提高 了 。 

下 面 是 有 关 下 界 的 一 些 重要 概念 的 总 结 : 

(D 问题 的 下 界 是 所 有 解决 该 问题 算法 的 最 小 时 间 复 杂 度 。 

(2) 下 界 越 高 越 好 。 

(3) 如 果 当 前 所 知 问题 的 下 界 比 解决 这 个 问题 的 最 可 行 算法 的 时 间 复 杂 度 低 ， 那 么 下 界 可 
以 通过 改善 算法 来 提高 ， 算 法 也 可 以 通过 降低 时 间 复 杂 度 来 改善 ， 或 两 方面 同时 进行 改善 。 

(4) 如 果 当 前 所 知道 的 下 界 等 于 可 行 算法 的 时 间 复 杂 度 ， 那 么 算法 和 下 界 都 不 能 再 改善 了 。 
算法 是 一 个 最 优 算法 ， 下 界 也 是 最 高 下 界 ， 是 真正 有 意义 的 下 界 。 

在 下 面 几 节 中 ， 我 们 将 讨论 一 些 找 下 界 的 方法 。 


2.4 排序 的 最 坏 情 况 下 界 


对 于 许多 算法 ,可 以 把 一 个 算法 的 执行 过 程 描述 成 一 棵 二 又 树 。 例 如 ， 考 虑 直接 插入 排序 ， 
假如 输入 3 个 互 不 相同 的 元 素 。 在 这 样 的 情况 下 ， 有 6 种 不 同 的 排列 : 


a, a, a, 
1 2 3 
1 3 2 
2 1 3 
2 3 1 
3 1 2 
3 2 1 


当 对 上 面 的 数据 集 进 行 直 接 插入 排序 时 ， 每 个 排列 都 引起 不 同 的 反应 。 例 如 ， 输 入 是 (2, 
3，1)， 直 接 插入 排序 执行 如 下 : 

(1) 比较 a = 2 和 as = 3， 由 于 cz>a， 因 此， 没有 数据 元 素 的 交换 。 

(2) 比较 a, = 3 和 a; = 1, 由 于 4;>a;， 因 此 ， 交换 a, 和 a;， 也 就 是 aa = 1，a; = 3。 

(3) 比较 a, = 2 和 a, = 1， HiFa,>a,, Al, 交换 wa Fila, , 也 就 是 al = 1, a,=2, 

如 果 输 入 数据 是 (2，1，3)， 算 法 的 执行 如 下 : 

(1) 比较 a, = 2 和 a, = 1， 由 于 a1>a,， 因 此 ， 交 换 a, 和 a,， 即 a, = 1 和 a, = 2。 

(2) 比较 a = 2 和 as = 3， 由 于 Qs<a;， 因 此 ， 不 发 生 数 据 交 换 。 

图 2-6 表 示 在 对 3 个 数据 元 素 排序 时 ， 直 接 插 入 排序 是 如 何 用 二 又 树 来 描述 的 。 这 棵 二 又 树 
也 很 容易 修改 ， 来 处 理 4 个 数据 元 素 的 情况 。 很 容易 看 到 当 应 用 到 任何 数目 的 数据 元 素 时 ， 直 
接 插 入 排序 可 以 用 二 又 决策 树 (binary decision tree) 来 描述 。 

通常 ， 基 本 操作 是 比较 和 交换 的 排序 算法 可 以 用 二 又 决策 树 来 描述 。 图 2-7 显 示 了 如 何 使 
用 二 又 决 策 树 来 描述 冒 泡 排序 。 在 图 2-7 中 ,假设 有 3 个 互 不 相同 的 数据 元 素 。 图 2-7 也 是 非常 
简化 的 ， 以 致 不 必 占 用 大 量 的 空间 。 因 为 对 冒 泡 排序 (bubble sort) 比较 熟悉 ， 所 以 在 这 里 就 
不 对 它 分 析 了 。 

基于 对 特定 输入 数据 集 进 行 比较 和 交换 操作 的 排序 算法 的 执行 ， 对 应 于 从 树 的 根 结 点 到 某 
个 叶子 结 点 的 一 条 路 径 。 因 此 ， 每 个 叶子 结 点 对 应 于 一 种 特定 的 排列 。 从 树 的 根 到 叶子 结 点 的 
最 长 路 径 称 为 树 的 深度 (depth) ， 对 应 着 该 算法 的 最 坏 情况 时 间 复 杂 度 。 为 了 找到 排序 问题 的 
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下 界 ， 必 须 在 模型 化 排序 算法 的 所 有 可 能 的 二 又 决策 树 中 ， 找 到 某 棵 树 的 最 小 深度 。 
ay >a 
> 
(2.1.3)-01.2.3) 
Ay > G2 | 31.241,32) 
(3.2.1)-(2,3.)) 初始 序列 
(1.2.3)-(1.2.3) (13.2)-(1.2.3) 
ay < az | 1.3.2)-.3.23 


(2.3, 2.1.3) 
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图 2-7 HR BHF RRR 

注意 下 面 的 要 点 : 

(1) 对 于 每 个 排序 算法 ， 因 为 有 n! 种 不 同 的 排列 ， 所 以 相应 的 二 又 决策 树 有 xn! 片 树 叶 。 

(2) 如 果树 是 平衡 的 (balanced)， 那 么 拥有 固定 数目 叶子 结 点 的 二 又 树 深度 是 最 小 的 。 

(3) 当 二 叉 树 是 平衡 的 ， 那 么 树 的 深度 是 [logX1， 其 中 X 是 叶 结 点 的 个 数 。 

基于 上 面 的 推理 ， 能 很 容易 地 推导 出 排序 问题 的 下 界 是 [lognt ， 也 就 是 说 ， 在 最 坏 情况 
下 ， 排 序 所 需要 的 比较 次 数 至 少 是 [logn], 

log n! 对 我 们 大 多 数 来 说 可 能 有 点 陌生。 我 们 的 确 不 知道 这 个 数字 有 多 大 ， 现 在 将 讨论 两 
个 近似 log n! 的 方法 。 
方法 1 

基于 下 面 的 事实 

log n! = log(n(n—1)---1) 


= > osi 


= (2—1)log 2 + (3—2)log 3 +--+ + (n— n + Ilog n 
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> f ‘log xdx 


= logef log, xdx 

= log e[x log,x-x]; 

= log e(n log.n—n + 1) 
=nlogn—nloge+ 1.44 
>n log n ~ 1.44n 


= n log H(t 人 
log n 


1.44 
MmESn=2?, An log n{ 1 = 0.28n log n, 





因此 ， 根 据 假设 m = 2 ， 及 c = 0.28， 可 以 得 到 
log n! > cn log nXf-FnSny 
也 就 是 说 ， 排 序 的 最 坏 情况 下 界 是 Qn log n). 
方法 2 斯 特 林 近 似 值 
当 n 非 常 大 时 ， 斯 特 林 (Stiring) 近似 值 用 下 面 的 公式 来 近似 n! 的 值 
nis (人 
\e/ 
这 个 公式 几乎 能 在 任何 一 本 高 级 微 积 分 书 上 找到 。 表 2-2 表 明了 斯 特 林 近 似 值 与 刀 有 多 接 
近 。 在 表 中 ， 用 5, 表 示 斯 特 林 近 似 值 。 
表 2-2 斯 特 林 近 似 值 的 一 些 值 








n n! Si 

1 1 0.922 

2 2 1.919 

3 6 5.825 

4 24 23.447 

5 120 118.02 

6 720 707.39 
10 3 628 800 3 598 600 
20 2.433 x 10" 2.423 x 10'8 

100 9.333 x 10!” 9.328 x 10'7 


-一 


使 用 斯 特 林 近 似 值 ， 将 得 到 


1 
log n! = log N27 +710g n+nlog— 
e 


= log V27 +5 logn + nlogn—nloge 
> n logn — 1.44n 
从 上 面 的 两 种 方法 中 ， 可 以 断定 在 最 坏 情 况 下 ， 排 序 所 需要 的 最 少 比较 次 数 是 Q(n log n) 
需要 提醒 的 是 ， 上 面 的 陈述 并 不 意味 着 不 能 找到 更 高 的 下 界 。 换 句 话说， 一 些 新 发 现 可 能 
让 我 们 知道 排序 的 下 界 实际 上 可 能 更 高 。 例 如 ， 很 可 能 有 人 可 找到 排序 的 下 界 是 2(z)。 
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在 接 下 来 的 - 节 中 ， 将 说 明 排 序 算法 的 最 坏 情 况 时 间 复 杂 度 等 于 刚 得 出 的 下 界 ， 因 为 这 样 
的 算法 存在 ， 该 下 界 就 不 能 进一步 提高 了 。 


2.5 EHF: 在 最 坏 情 况 下 最 优 的 排序 算法 


堆 排序 (heap sort) 是 一 种 时 间 复 杂 度 为 O(n log 四 的 排序 算法 。 在 介绍 堆 排序 之 前 ， 先 研 
究 一 下 直接 选择 排序 ， 来 理解 为 什么 在 最 坏 情况 下 它 不 是 最 优 的 。 对 于 直接 选择 排序 ， 需 要 
(n 一 1) 步 得 到 最 小 的 数 ， 然 后 需要 (n 一 2) 步 得 到 第 二 小 的 数 ， 依 此 类 推 ( 均 是 在 最 坏 的 情况 下 )。 
因此 ， 在 最 坏 情 况 下 ， 直 接 选 择 排序 需要 O(n”) 步 。 如 果 更 仔细 地 观察 直接 选择 排序 ， 当 尽力 
找 第 二 小 的 数 时 ， 在 寻找 第 一 小 的 数 时 所 推理 出 的 信息 根本 没有 用 到 。 这 就 是 直接 选择 排序 执 
行 效率 如 此 差 的 原因 。 

HEB AHR BE, ， 称 为 淘汰 排序 (knockout sort) ， 它 比 直接 选择 排序 好 得 多 。 淘 汰 排 
序 与 直接 选择 排序 比较 相似 ， 它 也 是 先 找到 最 小 的 数 ， 再 找 第 二 小 的 数 ， 依 此 类 推 。 但 是 在 找 
到 第 一 小 的 数 后 ， 它 保留 一 些 信息 ， 对 查找 第 二 小 的 数 非常 有 效 。 

考虑 输入 数列 2，4，7，3，1，6，5，8。 可 以 构建 淘汰 树 (knockout tree) 找 最 小 的 数 ， 
如 图 2-8 所 示 。 

在 找到 最 小 数 之 后 ， 通 过 用 % 代 赫 1 来 找 第 二 小 的 数 。 只 需要 考查 淘汰 树 的 一 小 部 分 ， 如 


人 AN、\ /N /A、\ 


AAAA A 人 


图 2-8 找 最 小 数 的 淘汰 树 图 2-9 找 出 第 二 小 的 数 
在 每 次 找 出 一 个 最 小 的 数 之 后 ， 用 w 来 代替 它 ， 很 
容易 找 出 下 一 个 最 小 的 数 。 例 如 ， 现 在 已 经 找 出 前 两 个 一 N, 
最 小 数 ， 第 三 小 数 可 以 如 图 2-10 找 出 。 
下 面 确定 淘汰 排序 的 时 间 复杂 度 : / A 
在 进行 (n 一 1) 次 比较 后 ， 找 出 第 一 小 的 数 。 对 于 所 有 


其 他 选择 ， 只 需要 flogx]-1 次 比较 。 因 此 ， 总 的 比较 次 
BOE /N 


(n—1)+(n—1) flogn}-1) 


因此 ， 淘 汰 排序 的 时 间 复杂 度 是 O(n log n), KEF 图 2-10 在 淘汰 排序 中 找 出 第 三 小 的 数 
在 2.4 节 中 确定 的 下 界 。 所 以 ， 淘 汰 排序 是 一 个 最 优 的 排序 算法 。 必 须 指 明 的 是 ， 在 最 好 、 平 
均 和 最 坏 情 况 下 ， 了 时 间 复 杂 度 为 O(n log n) 的 算法 都 是 有 效 的 。 

淘汰 排序 比 直接 选择 排序 好 的 原因 是 它 利用 了 前 面 的 信息 。 遗 憾 的 是 ， 淘 状 树 需要 额外 的 
空间 。 完 成 淘汰 排序 需要 约 2n 个 附加 的 空间 。 淘 汰 排序 可 改进 成 堆 排序 ， 在 本 节 的 剩余 部 分 将 
讨论 它 。 

与 淘汰 排序 相似 , 堆 排序 使 用 一 种 特殊 的 数据 结构 来 存储 数据 。 该 数据 结构 称 为 堆 (heap). 
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堆 是 满足 下 列 条 件 的 二 又 树 : 

(1) 此 树 是 完全 平衡 的 。 

(2) 如 果 该 二 又 树 的 高 度 为 £， 那 么 叶子 结 点 在 h 层 或 h 一 1 层 。 

(3) 在 h 层 的 所 有 叶子 尽 可 能 在 左边 。 

(4) 一 个 结 点 的 所 有 后 代 相 关 的 数据 小 于 该 结 点 上 的 数据 。 

图 2-11 显 示 了 一 个 具有 10 个 数 的 堆 。 

依照 定义 ， 堆 的 根 结 点 4(1) 是 最 大 的 数 。 假 如 堆 已 经 构造 成 了 ( 堆 的 构造 将 在 以 后 讨论 )， 
那么 可 以 输出 4(1)。 在 输出 最 大 的 数 4(1) 之 后 ， 原 来 的 堆 就 不 再 是 一 个 堆 了 。 现 在 用 4(n) = 
4(10) 来 代替 4(1)， 那 么 ， 将 有 如 图 2-12 所 显示 的 树 。 

四 





图 2-11 一 个 堆 图 2-12 ”用 A(10) 代 赫 A(1) 


图 2-12 所 示 的 平衡 二 又 树 不 是 堆 ， 但 是 它 可 以 很 容易 地 恢复 成 一 个 堆 ， 如 图 2-13 所 示 。 图 
2-13c 所 示 的 二 叉 树 是 一 个 堆 。 


PO ® © 
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图 2-13 堆 的 恢复 
通过 图 2-14 能 更 好 地 理解 恢复 过 程 。 


递归 地 应 用 
恢复 过 程 





图 2-14 恢复 过 程 
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Bik2-6 堆 的 恢复 过 程 Restore(i, j) 
MA: AD, AGD, =, AQ) 
输出 : AD, AGD, ©, AGRA THE. 
如 果 4(D 不 是 叶子 ， 且 4(D) 的 某 个 孩子 舍 有 比 4(D) 大 的 元 素 ， 那 么 
Begin 
令 4( 站 是 4(0 的 最 大 的 孩子 元 素 
交换 4( 站 和 A(h) 
Restore(h. j) 
End 


参数 /用 于 确定 4(G) 是 否 叶 子 ， 以 及 4(D) 是 否 有 两 个 孩子 。 如 果 ;i >j/2, PAADRHF, H 
restore(i， 什么 也 不 做 ， 因 为 4( 让 自身 已 经 是 一 个 堆 了 。 

在 堆 排序 中 有 两 个 重要 的 方面 : 

(1) 堆 的 构建 。 

(2) 移 走 最 大 的 数 ， 并 且 恢 复 堆 。 

假设 堆 已 经 构建 好 了 ， 那 么 堆 排序 描述 如 下 : 


算法 2-7 MAE 
输入 : 4(1)，4(2)，…，A(n)， 其 中 每 个 4Q) 已 经 是 构建 好 的 堆 结 点 。 
输出 :4() 的 有 序 序列 。 
For i := n down to 2 do 
Begin 
Output A(1) 
A(!): = Ai) 
Delete A(i) 
Restore(1, i-1) 
End 
Output A(1) 


例 2-6 堆 排 序 
下 面 的 步骤 说 明 一 个 典型 的 堆 排序 实例 。 





wees 


s 5 be 
输出 26 _ 
© 








KEELER SPR FR 31 








堆 漂 亮 的 特性 是 能 够 用 一 个 数组 来 表示 一 个 堆 。 也 就 是 ， 不 需要 指针 ， 因 为 堆 是 一 棵 完全 
平衡 的 二 又 树 ， 每 个 结 点 和 它 的 孩子 都 唯一 地 确定 。 规 则 是 非常 简单 的 : 如 果 存 在 的 话 ， 那 么 
4( 各 的 孩子 就 是 4(2 加 和 4(2A + 1)。 

在 图 2-11 中 所 示 的 堆 现 存储 在 一 个 数组 中 : 


A(1) A(2) A(3) A(4) A(5) A(6) A(7) A(8) A(9) A(10) 








51 48 37 17 28 30 25 6 5 21 





例如 ， 考 虑 4(2)， 它 的 左 孩子 是 4(4) = 17。 
考虑 4(3)， 它 的 右 孩 子 是 4(7) = 25。 
堆 排序 的 整个 过 程 能 在 一 个 数组 中 进行 。 例 如 ， 例 2-6 中 的 堆 排序 可 以 描述 如 下 : 


48 37 26 15 4 
48 — 4 37 26 15 
Nag 
37 4 26 15 
\ -~ 
37 15 26 4 
37 <— 4 15 26 
S 


26 — 4 15 
\ 
15 4 

15 “一 一 4 

4 e— 


堆 的 构建 

为 了 构建 一 个 堆 ， 考 虑 图 2-14， 其 中 的 二 叉 树 并 不 是 一 个 堆 ， 但 是 在 树 根 下面 的 两 棵 子 树 
是 堆 。 对 于 这 种 树 ， 可 以 使 用 恢复 过 程 来 “构建 ” 堆 。 堆 的 构建 基于 上 面 的 思想 ， 从 任意 的 完 
全 平衡 二 又 树 开始 ， 反 复 地 调用 恢复 过 程 来 逐渐 将 它 转变 成 一 个 堆 。 

令 A(1)，4(2)，…，A(m) 是 一 棵 完全 平衡 二 又 树 ， 它 在 最 高 层 的 叶子 结 点 尽量 在 左边 排列 。 
对 此 二 又 树 ， 我 们 能 看 到 4(D (=1, 2, 0, W2) 是 具有 孩子 的 内 部 结 点 ，4(i) (i= nm/21+ 
1，-…，n) 一定 是 没有 孩子 的 叶子 结 点 。 全 部 的 叶子 结 点 可 以 认为 已 经 是 堆 。 因 此 ， 不 必 对 这 
些 叶子 执行 任何 操作 。 堆 的 构建 从 恢复 根 结 点 在 Ln/2| 处 的 子 树 开始 。 构 建 堆 的 算法 如 下 : 


算法 2-8 HME 


输入 : AG), A2), =, An) 
输 由 ，A(1)，A(2)，…，A(n) 成 为 一 个 堆 。 
For i := |n/2| down to 1 do 


Restore(i, n) 
0 


例 2-7 堆 的 构建 
考虑 下 面 的 二 又 树 ， 它 不 是 一 个 堆 。 











在 这 个 堆 中 , 4 =5，[n/2| =2。 因 此 ,恢复 根 结 点 在 4(2) 的 子 树 如 下 : 


NR- 


—— 


然后 恢复 A(1): 


堆 排 序 是 淘汰 排序 的 改进 ， 因 为 它 使 用 线性 数组 来 表示 堆 。 接 下 来 分 析 堆 排序 的 时 间 复 杂 度 。 
构建 堆 的 最 坏 情况 分 析 

假设 要 排序 个 数 ， 因 此 完全 平衡 二 又 树 的 深度 d 为 lLlog nj。 对 于 每 个 内 部 结 点 ， 必 须 进行 
两 次 比较 。 假 设 一 个 内 部 结 点 的 层次 为 L-， 那 么 ， 在 最 坏 情 况 下 完成 恢复 过 程 必须 进行 2(d 一 L) 
次 比较 。L 层 最 多 的 结 点 数 是 2*， 那 么 在 整个 构建 阶段 ， 比 较 的 总 次 数 至 多 为 


d-t d-l d-l 
$ xd- 7)27 = 2a 2" -4912 


2.2 节 中 ， 在 等 式 (2-1) 中 已 证 明了 
k 
ae =2(k-1)+1 


所 以 ， 


d-i d-! d-l 
$ 2d- L)2' = 2492" -45 L20! 
.=() mi) 一 0 


= 2d(2"~1) — 4(2 "(d-1-1) + 1) 

= 2a(2"-1) — 4(d2"~ '— 24+ 1) 
=4-2d-2d-4 

=4 . 22r |2 log n|J— 4 

=c¢n — |2 lognj- 4 其 中 2<c<4 
scn 
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因此 ， 在 最 坏 情况 下 构建 一 个 堆 总 的 比较 次 数 为 O(n)。 
从 谁 中 删除 元 素 的 时 间 复 杂 度 
如 前 所 述 ， 在 -~ 个 堆 构 建 后 ， 堆 的 根 是 最 大 的 数 ， 现 在 它 可 被 删除 (或 输出 )。 现 在 分 析 
从 具有 n 个 元 素 的 堆 中 ， 输 出 全 部 的 数据 元 素 所 需要 的 比较 次 数 。 注 意 ， 在 删除 一 个 数 后 ， 如 
果 剩 余 i 个 元 素 ， 那 么 在 最 坏 的 情况 下 ， 恢 复 堆 需 要 2lLlogi 次 比较 。 因 此 ， 删 除 全 部 数据 所 需 
25 [iosi] 


为 了 估算 这 个 公式 ， 考 虑 2 = 10 的 情况 。 
llog 1] =0 
[log 2] = llog 3] = 1 
[log 4] = [log 5] = [log 6] = [log 7] = 2 
llog 8] = [log 9] =3 
可 以 看 到 
2 ' 个 数 等 于 llog 2 ]= 1 
2 个 数 等 于 llog 27] = 2 

及 10 — 2lee l= 10 一 23 = 2 个 数 等 于 |log njo 
总 之 ， 


nl [logn =] 
>> [logi] = 2 5o +2(n—2!°*"])| log n | 


[logn ~I 
4 yin" +2(n- 2D logn | 


利用 die" =2(k-l) +1 (2.2 节 中 的 等 式 (2-1))， 可 以 得 到 


n=l [loga -l 
25 liogi| = 4 ya +2(n-2!""l) logn] 


= 4(2l° "(|log n|—1—1) + 1) + 2n|log n] —2llog n |2" ”! 
=2 . 22" Jog nj—8 + 208"! + 4 + 2n|log n|— 2 - 2!°8"Llog n] 
=2-nllogn|—4- 28 44 
=2n|logn]—4cn +4 其 中 2<c<4 
= O(n log n) 
因此 ， 从 一 个 堆 中 得 到 所 有 元 素 的 有 序 序 列 ， 其 最 坏 情况 时 间 的 复杂 度 为 O(n log n), 
总 之 ,可 推导 出 在 最 坏 情 况 下 ， 堆 排序 的 时 间 复 杂 度 为 O(n log n)。 在 此 要 强调 堆 排 序 的 
时 间 复 杂 度 达到 O(n log 四)， 本 质 上 是 因为 它 以 这 样 的 方法 使 用 数据 结构 ， 即 每 个 输出 操作 至 
多 需要 llog ij 步 ， 其 中 ;为 剩余 的 数据 元 素 个 数 。 对 于 堆 排 序 来 说 ， 这 个 聪明 的 数据 结构 设计 是 
最 为 本 质 的 。 


2.6 排序 的 平均 情况 下 界 
在 2.4 节 中 已 讨论 了 排序 的 最 坏 情 况 下 界 。 本 节 将 推导 出 排序 问题 的 平均 情况 下 界 ， 仍 使 
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用 二 又 决策 树 模型 。 

正如 前 面 所 讨论 ， 每 个 基于 比较 的 排序 算法 都 能 使 用 二 叉 决 策 树 描述 。 在 这 样 的 二 又 决策 
树 中 ,从 树 的 根 结 点 到 叶子 结 点 的 一 条 路 径 对 应 于 算法 对 一 个 特定 输入 实例 的 执行 过 程 。 另 外 ， 
路 径 的 长 度 等 于 对 输入 数 集 进行 的 比较 次 数 。 定 义 树 的 外 部 路 径 长 度 (external path length) 为 
从 根 结 点 到 每 个 叶子 结 点 的 路 径 长 度 的 总 和 。 那 么 基于 比较 的 排序 算法 的 平均 时 间 复 杂 度 等 于 
被 刀片 叶子 结 点 所 分 割 算法 对 应 的 二 又 决策 树 的 外 部 路 径 长 度 。 

为 了 找 出 排序 的 平均 时 间 复 杂 度 下 界 ， 必 须 找到 拥有 局 个 叶子 结 点 的 所 有 可 能 二 又 树 的 最 
小 外 部 路 径 长 度 。 在 拥有 固定 数目 的 叶子 结 


点 的 所 有 可 能 的 二 叉 树 中 ， 平 衡 二 叉 树 的 外 

部 路 径 长 度 最 短 。 也 就 是 ， 如 果 层 次 是 d 的 话 ， x ` 
那么 所 有 叶子 结 点 在 d 层 或 4-1 层 。 考 虑 图 ， 

2-15。 图 2-15a 中 的 二 叉 树 不 是 平衡 的 。 这 棵 树 y 

的 外 部 路 径 长 度 是 4x3+1 = 13。 现 在 可 以 将 Y 

的 两 个 孩子 附加 到 X 上 来 减少 它 的 外 部 路 径 长 

度 ， 现 在 的 外 部 路 径 长 变 成 为 2x3+3x2=12。 , F 


一 般 的 情况 描述 在 图 2-16 中 。 假 设 在 a 层 
上 有 一 个 叶子 结 点 ， 树 的 深度 为 4， 其 中 a 图 2-15 非 平衡 二 又 树 的 修改 
d--2。 这 棵 树 可 以 这 样 修改 ， 不 改变 叶子 结 点 的 个 数 而 使 外 部 路 径 长 度 减少 。 为 了 修改 此 树 ， 
选择 在 d 层 上 有 孩子 的 d 一 1 层 结 点 。 令 在 a 层 上 的 叶子 结 点 和 在 4 一 1 层 上 的 结 点 分 别 用 X 和 7 了 表 示 。 
将 了 的 孩子 移动 到 X 上 ， 对 于 结 点 Y， 它 原来 有 2 个 孩子 ， 且 
路 径 长 度 的 和 为 24。 现 在 ，Y 变 成 了 一 个 叶子 结 点 ， 且 它 的 | 
路 径 长 度 为 4~-1。 这 个 移动 使 外 部 路 径 长 度 减少 了 2d 一 (d 一 1) X Ba 
= d + 1。 对 于 X 结 点 ， 之 前 它 有 一 个 时 子 结 点 。 现 在 , CR 4 s 
为 一 个 内 部 结 点 ， 它 的 两 个 孩子 结 点 成 为 叶子 结 点 。 原 先 ， Y 
它 的 路 径 长 度 是 a ， 现 在 两 个 新 的 路 径 长 度 总 和 是 2(a +1). 
因此 ， 添 加 操作 使 外 部 路 径 长 度 增 加 了 2(a + D-a = a + 2。 
这 样 ， 净 变化 是 (d + D)-(a + 2) = (d-a)-1 22-1 = 1。 即 净 
变化 减少 了 外 部 路 径 长 度 。 

因此 ， 一 棵 非 平衡 二 叉 树 可 以 通过 修改 使 外 部 路 径 长 度 减少 。 当 且 仅 当 该 树 是 平衡 的 ， 二 
叉 树 的 外 部 路 径 长 度 最 小 。 

令 共 有 c 个 叶子 结 点 。 现 在 来 计算 有 c 个 叶子 结 点 的 平衡 二 又 树 的 外 部 路 径 长 度 ， 通 过 下 面 
的 推理 可 以 得 出 外 部 路 径 长 度 : 

(1) 树 的 深度 是 4 = [log c]， 叶 子 结 点 只 出 现在 d 层 或 4-1 层 上 。 

(2) 令 在 d 一 1 层 上 有 xi 个 叶子 结 点 ， 在 d 层 上 有 2 个 叶子 结 点 ， 那 么 有 x + Xx, = Cc。 

(3) 为 简化 讨论 ， 假 设 在 d 层 上 的 结 点 数 为 偶数 。 读 者 很 容易 理解 ， 如 果 在 d 层 上 的 结 点 数 
是 奇数 ， 那 么 下 面 的 结果 依然 成 立 。 对 d 层 上 的 每 两 个 结 点 ， 在 d 一 ! 层 上 都 有 一 个 父 结 点 。 这 
个 父 结 点 不 是 叶子 结 点 。 因 此 ， 可 以 有 下 面 的 公式 : 


x+ 和 妇 = Qe! 
2 


图 2-16 不 平衡 的 二 又 树 


(4) 求解 这 两 个 方程 ， 可 以 得 到 


x — 
22 = ç—2^' 
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x = 2(c 一 24 1) 
x, = 2 一 c 
(5) 外 部 路 径 长 度 是 
x\(d—1) + xd 
= (2 一 c)(d 一 1) + (2c—2")d 
=c + cd—2! 


(6) 由 于 d = [loge], 将 log c<d<log c +1 代 和 人 到 上 面 的 等 式 ， 得 到 c + cd -2/<c + c (log ce) 
一 2.22* = c log c -c。 因 此 ， 外 部 路 径 长 度 大 于 c log c—c = n! log nl 一 n!。 所 以 排序 的 平均 情况 
时 间 复 杂 度 大 于 


nilogn!—n! 
oe = log n!-1 

使 用 2.4 节 所 讨论 的 结果 ， 得 出 排序 问题 的 平均 情况 下 界 是 Qnlog 四。 

在 2.2 节 中 的 例 2-4 中 ， 已 证 明了 快速 排序 的 平均 情况 时 间 复 杂 度 是 O(n log n)。 因 此 ， 就 平 
均 情 况 而 言 ， 快 速 排序 是 最 优 的 算法 。 

在 2.2 节 中 的 例 2-3 中 ， 已 证 明了 直接 选择 排序 的 平均 情况 时 间 复 杂 度 也 是 O(n log n)。 然 而 ， 
必须 明白 这 个 时 间 复 杂 度 是 依据 标记 的 改变 。 直 接 选 择 排 序 在 平均 情况 和 最 坏 情 况 下 的 比较 次 
数 是 n(n 一 1)/2。 因 为 在 实际 的 编程 中 ， 主 要 的 时 间 因 素 是 比较 的 次 数 ， 所 以 直接 选择 排序 在 实 
践 中 是 非常 慢 的 。 

著名 的 冒 泡 排序 和 直接 插入 排序 一 样 ， 平 均 情况 的 时 间 复 杂 度 是 O(n)。 实 验 告 诉 我 们 冒 
泡 排 序 比 快速 排序 慢 得 多 。 

最 后 , 看 看 在 2.5 节 中 所 讨论 的 堆 排 序 。 在 最 坏 的 情况 下 ， 堆 排序 的 时 间 复 杂 度 是 O(n log n), 
堆 排序 的 平均 情况 时 间 复 杂 度 还 没有 找到 。 然 而 ， 因 为 在 这 一 节 中 找 出 的 下 界 ， 我 们 知道 它 必 
定 大 于 或 等 于 O(n log n)， 但是， 因为 它 的 最 坏 情 况 下 的 时 间 复 杂 度 是 O(n log n)， 所 以 它 不 能 
比 O(n log mn) 大 。 因 此 ， 我 们 推断 出 堆 排序 平均 情况 下 的 时 间 复 杂 度 是 O(n log n). 


2.7 通过 神 论 改 进 下 界 


在 前 面 各 节 中 ， 已 说 明了 如 何 用 二 叉 决 策 树 模型 得 到 排序 的 下 界 ， 这 只 能 侥幸 得 到 一 个 好 
的 下 界 ， 也 就 是 存在 一 个 最 坏 情 况 下 的 时 间 复 杂 度 恰好 等 于 这 个 下 界 的 算法 。 因 此 ， 我 们 能 确 
定 下 界 不 能 再 提高 了 。 

在 本 节 中 ， 将 要 说 明 二 又 决策 树 模型 不 能 产生 更 有 意义 下 界 的 情况 。 也 就 是 ， 将 说 明 通过 
使 用 二 叉 决 策 树 模型 能 进一步 提高 所 得 到 的 下 界 。 

考虑 合并 问题 (merging problem)。 如 果 合并 算法 基于 比较 和 交换 操作 ， 那 么 能 够 使 用 决 
策 树 模型 。 合 并 问题 的 下 界 能 用 推导 排序 下 界 的 方法 得 出 。 在 排序 中 ， 叶 子 结 点 的 数目 是 n!， 
排序 的 下 界 因 此 为 [logzn!j。 在 合并 问题 中 ， 叶 子 结 点 的 数目 也 是 想 区 别 的 不 同情 况 的 数目 。 
因此 ， 给 定 2 个 有 序 序列 4 和 8B， 分 别 有 m 和 n 个 元 素 ， 那 么 能 合并 成 多 少 个 不 同 的 队列 昵 ?再 一 
次 简化 讨论 ， 假 如 全 部 (m + 功 个 元 素 是 不 同 的 ， 在 不 打 乱 序列 4 和 8 原来 的 次 序 情况 下 ， 将 个 


元 素 合 并 到 m 个 元 素 中 ， 总 共有 (mn 种 方法 ， 这 意味 着 能 得 到 合并 问题 的 下 界 为 


区 wy) 
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然而 ， 从 来 还 设 有 找 出 任何 合并 算法 能 达到 这 个 下 界 。 
考虑 - -个 通常 的 比较 两 个 有 序 序列 的 最 大 元 素 ， 并 输出 较 小 元 素 的 合并 算法 。 在 这 种 合并 
算法 中 ， 最 坏 情况 下 的 时 间 复 杂 度 为 m + n-1， 这 大 于 或 等 于 


本 
ee) <m+n-l 


我 们 怎样 弥补 这 个 差距 ? 像 前 面 讨论 的 一样， 增 大 下 界 或 者 找到 一 个 有 更 低 时 间 复 杂 度 的 
好 算法 。 事 实 上 ， 很 有 趣 地 是 当 m = rn 时， 合并 问题 的 另 一 个 下 界 是 m+ n—-1 = 2n-1, 

可 通过 使 用 神 论 方法 (oracle approach) 来 说 明 该 情况 。 神 论 将 提供 给 我 们 一 种 非常 难 的 
情况 (一 个 特定 的 输入 数据 ) 。 如 果 对 这 个 数据 集 应 用 一 种 算法 解决 该 问题 ， 算 法 执行 很 困难 。 
使 用 这 个 数据 集 ， 可 以 得 出 最 坏 情况 下 的 下 界 。 

假设 有 两 个 数列 wj，a，…，a 和 证 ，b，…，bu。 另 外 ， 考 虑 一 个 很 困难 的 情况 
a, <b, <ay<-a,<b,, 假设 某 个 合并 算法 已 经 正确 地 将 ai， d2, U, a; Aib, by, os bi 生成 
下 面 的 有 序 序列 ， 


即 我 们 得 到 如 下 的 不 等 式 


a, bi, vy Gy, bi 

然而 ， 假 如 这 个 合并 算法 不 比较 a; 和 4b;。 显 然 ， 算 法 没有 办 法 确定 5b; ,后面 是 a 还 是 b;。 因 
此 ，a 和 4b 必须 比较 。 基 于 相同 的 原因 ， 能 证 明 在 a, 放 在 b;., 后 ，b; 和 a; , ,也 必须 能 比较 。 总 之 ， 
每 个 hb 必须 同 a; 和 a , 比较。 所以， 当 m = n 上 时 ， 合 并 算法 总 共 需 要 比较 24 一 1 次 。 需 要 提醒 读者 ， 
只 有 当 m = nn 上 时， 这 个 合并 算法 的 下 界 2n 一 1 才 是 有 效 的 。 

因为 当 m = an 时， 一 般 的 合并 算法 需要 2n 一 1 次 。 在 最 坏 情 况 下 的 时 间 复 杂 度 等 于 它 的 下 界 ， 
所 以 得 出 结论 合并 算法 是 最 优 的 。 

上 面 的 讨论 说 明 有 时 能 将 下 界 提 高 。 


2.8 通过 问题 转换 求 下 界 


在 前 面 各 节 中 ， 通 过 直接 分 析 问 题 来 找 下 界 。 有 些 时 候 ， 这 显得 很 困难 。 例 如 ， 吓 包 问 题 
(convex hull problem) 是 找 一 组 平面 点 的 最 小 凸 多 边 形 问题 。 凸 包 问 题 的 下 界 是 多 少 ? 看 来 很 
难 直 接 找 到 这 个 问题 有 意义 的 下 界 。 但 是 ， 下 面 将 证 明 通 过 转变 该 问题 成 排序 问题 ， 可 很 容易 
得 到 这 个 问题 的 下 界 ， 排 序 问 题 的 下 界 是 已 知 的 。 

假如 一 组 数据 排 成 有 序 的 Xx!,，x,，…，x,。 不 失 一 般 性 ， 假 设 x,<x2<…<x,。 然 后 ， 将 每 个 
x 和 x? 结 合 形成 一 个 2 维 的 点 (x;:，x7)， 全 部 新 产生 的 点 都 位 于 抛物 线 y = 上。 考虑 这 个 (x， 
交点 之 外 所 构成 的 凸 包 。 如 图 2-17 所 示 ， 这 个 凸 包 由 一 组 有 序 的 数组 成 。 换 句 话 说， 通过 解决 
号 包 问题 ， 能 解决 排序 问题 。 排 序 的 总 时 间 等 于 转换 的 时 间 加 上 解决 山 包 问题 的 时 间 。 因 此 ， 
山 包 问题 的 下 界 等 于 排序 问题 的 下 界 减 去 转换 的 时 间 。 也 就 是 由 于 转换 花费 Q(n) 步 ， 凸 包 的 下 
界 不 低 于 Q(n log nAn) = Qn log n)， 因 为 一 个 算法 只 需要 Qn log nn) 步 解决 吓 包 问题 ， 所 以 
它 的 下 界 不 能 更 进一步 提高 了 。 

在 一 般 情况 下 ， 假 设想 找 出 问题 P, 的 下 界 ， 并 存在 一 个 已 知 下 界 的 问题 Pp。 进 一 步 ， 假 如 
用 一 种 方法 能 将 P, 转 变 成 P,， 在 这 种 方法 能 在 解决 P, 之 后 ， 也 能 解决 P,。 令 Qi(R)) 和 人 U2(n)) 
分 别 表示 Pl 和 P; 的 下 界 ，O(g(n)) 表 示 将 P, 转 化 为 P, 所 需要 的 时 间 ， 那 么 
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Q(f\(n)) + O(g(n)) > Q(f,(n)) 

Fn)) > Qf 2(n))—O(g(n)) 

现在 举 另 一 个 例子 来 说 明 这 种 方法 的 可 行 性 。 假如 想 找 出 欧 几 里 得 最 小 生成 树 问题 的 下 界 。 
因为 很 难 直 接 得 到 P 的 和 下界， 再 次 考虑 排序 问题 P,。 定 义 转换 ， 对 每 个 x;,， 令 (x;，0) 是 一 个 2 维 
的 点 。 只 要 最 小 生成 树 由 这 些 (x;，0) 点 构造 而 成 ， 那 么 排序 将 完成 。 再 一 次 假设 当 且 仅 当 j = 
i+ 1 时 ，x1<xs<<…<x,， 在 最 小 生成 树 的 (x;，0) 和 (x;，0) 之 间 有 一 条 边 。 因 此 ， 欧 几 里 得 最 小 生 
成 树 问 题 的 解 也 是 排序 问题 的 解 。 再 次 ， 我 们 知道 欧 几 里 得 最 小 生成 树 的 下 界 是 Qn log n). 





e Qix’) 





图 2-17 一 个 排序 问题 的 数据 构造 的 凸 包 问题 


2.9 注释 与 参考 


本 章 介绍 了 算法 分 析 的 一 些 基本 概念 。 对 于 算法 分 析 这 个 主题 更 多 的 研究 ， 可 参阅 Basse 
and Van Gelder(2000); Aho, Hopcroft and Ullman(1974); Greene and Knuth(1981); Horowitz, 
Sahni and Rajasekaran(1998) 和 Purdom and Brown(1985a)。 几 位 图 灵 奖 获得 者 都 是 优秀 的 算法 研 
究 者 。 在 1987 年 ，ACM 出 版 社 出 版 了 20 位 图 灵 奖 获得 者 的 演讲 论文 集 (Ashenhurst，1987)。 
在 该 卷 中 ，Rabin、Knuth、Cook 和 Karp 的 演讲 都 讨论 了 算法 的 复杂 度 。1986 年 的 图 灵 奖 获得 
者 是 Hopcroft 和 Tarjan。Tarjan 的 获 图 灵 奖 演讲 是 关于 算法 设计 的 ， 该 演讲 可 参考 文献 Tarjan 
(1987)。 文 献 Weide(1977) 对 算法 分 析 技 术 也 做 了 概述 。 

本 章 介绍 了 几 种 排序 算法 。 为 了 对 排序 和 查找 有 更 全 面 的 讨论 ， 读 者 可 以 阅读 文献 Knuth 
(1973)。 对 于 直接 插入 排序 、 二 分 搜索 和 直接 选择 排序 等 更 多 的 分 析 ， 可 分 别 阅读 文献 Knuth 
(1973) 的 5.2.1 节 、6.2.1 节 和 5.2.3 节 。 快速 排序 归功 于 Hoare(1961，1962)。 堆 排 序 由 Williams 
(1964) 发 现 。 关 于 排序 的 下 界 ， 可 参阅 文献 Knuth(1973) 的 5.3.1 节 。 更 多 关于 淘汰 排序 的 信息 可 
参阅 Knuth(1973) 的 5.2.3 节 。 

关于 树 的 基本 术语 可 在 许多 数据 结构 教科 书 中 找到 。 例 如 ， 文 献 Horowitz and Sahni(1976) 
的 5.1 节 和 5.2 节 。 树 的 深度 也 称 树 的 高 度 。 关 于 树 的 外 部 路 径 长 度 更 多 的 分 析 和 完全 二 又 树 的 
作用 可 参阅 文献 Knuth(1969) 的 2.3.4.5 节 。 

关于 最 小 生成 树 问题 的 研究 可 在 文献 Preparata and Shamos(1985) 的 6.1 节 中 找到 。 有 更 多 的 
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关于 秩 确定 问题 的 信息 可 在 文献 Shamos(1978) 的 4.1 节 和 Preparata and Shamos (1985) 的 8.8.3 节 
中 找到 。 查 找 中 值 的 平均 时 间 复 杂 度 的 证 明 可 在 文献 Horowitz and Sahni(1978) 的 3.6 节 中 找到 。 

关于 通过 神 论 改 进 下 界 的 资料 可 参阅 文献 Knuth(1973) 的 5.3.2 节 和 Horowitz and Sahni(1978) 
的 10.2 节 。 关 于 通过 问题 转换 求 下 界 的 资料 可 参阅 文献 Shamos(1978) 的 6.1.4 节 和 Preparata and 
Shamos(1985) 的 3.2 节 及 5.3 节 。 在 文献 Shamos(1978) 和 Preparata and Shamos(1985) 中 有 更 多 的 
关于 通过 转换 求 下 界 的 例子 。 


2.10 进一步 的 阅读 资料 


下 界 理论 一 直 吸 引 着 众多 的 研究 者 。 关 于 该 主题 一 些 最 近 出 版 的 论文 包括 : Dobkin and 
Lipton (1979); Edwards and Elphick (1983)，Frederickson (1984); Fredman (1981), Grandjean 
(1988); Hasham and Sack (1987); Hayward (1987); John (1988); Karp (1972); McDiarmid 
(1988); Mehlhorn, Naher and Alt (1988); Moran, Snir and Manber (1985); Nakayama, 
Nishizeki and Saito (1985); Rangan (1983); Traub and Wozniakowski (1984); Yao (1981); and 
Yao (1985), 

最 新 的 -- 些 非常 有 兴趣 的 出 版 论文 可 参阅 :， Berman, Karpinski, Larmore, Plandowski and 
Rytter (2002); Blazewicz and Kasprzak (2003), Bodlaender, Downey, Fellows and Wareham 
(1995); Boldi and Vigna (1999); Bonizzoni and Vedova (2001); Bryant (1999), Cole (1994); 
Cole and Hariharan (1997); Cole, Farach-Colton, Hariharan, Przytycka and Thorup (2000), 
Cole, Hariharan, Paterson and Zwick (1995); Crescenzi, Goldman, Papadimitriou, Piccolboni 
and Yannakakis (1998); Darve (2000); Day (1987); Decatur, Goldreich and Ron (1999); Demri 
and Schnoebelen (2002); Downey, Fellows, Vardy and Whittle (1999), Hasegawa and Horai 
(1991); Hoang and Thierauf (2003); Jerrum (1985); Juedes and Lutz (1995); Kannan, Lawler 
and Warnow (1996); Kaplan and Shamir (1994); Kontogiannis (2002), Leoncini, Manzini and 
Margara (1999), Maes (1990); Maier (1978); Marion (2003); Martinez and Roura (2001); 
Matousek (1991); Naor and Ruah (2001); Novak and Wozniakowski (2000); Owolabi and 
McGregor (1988); Pacholski, Szwast and Tendera (2000); and Peleg and Rubinovich (2000); 
and Ponzio, Radhakrishnan and Venkatesh (2001), 


习题 


2.1 给 出 在 最 好 、 最 坏 和 平均 情况 下 的 冒 泡 排 序 所 需要 交换 元 素 的 次 数 ， 冒 泡 排 序 几乎 在 任何 关于 
算法 的 书 上 都 有 定义 。 最 好 情况 下 和 最 坏 情况 下 的 分 析 是 简单 的 ， 平 均 情况 下 的 分 析 可 以 通过 
以 下 的 过 程 得 到 : 

(1) 定义 一 个 排列 的 逆序 。 令 a1/，a,，…，as 是 集合 (1，2，.…，n) 的 排列 。 如 果 i<j 且 a) <a, 
那么 (a;，a) 称 为 这 个 排序 的 一 个 逆序 。 例 如 ，(3，2)、(3，1)、(2,，1) 和 (4, 1) 是 排列 
(3, 2, 1, 4) 的 全 部 逆序 。 

(2) 找 出 已 知 正好 有 k 个 逆序 的 排序 和 n 个 元 素 恰 好 有 k 个 逆序 的 排序 次 数 之 间 的 概率 关系 。 

(3) 利用 归纳 法 ， 证 明 冒 泡 排 序 所 需要 的 平均 情况 下 交换 元 素 的 次 数 为 n(n 一 1)/4。 

22 为 冒 泡 排序 写 一 个 程序 ， 运 行 一 个 实验 说 明 它 的 平均 性 能 确实 是 0(7)。 

2.3 找到 Ford-Johnson 排 序 算法 。 该 算法 在 很 多 关于 算法 的 书 中 都 有 介绍 。 已 经 证 明 在 n<12 时 ， 算 
法 是 最 优 的 。 在 计算 机 上 执行 这 个 算法 ， 与 另 一 个 排序 算法 比较 。 你 喜欢 这 个 算法 吗 ? 如 果 不 
喜欢 ， 设 法 确定 分 析 有 什么 问题 。 

2.4 证 明 : 对 5 个 数 进行 排序 ， 至 少 需要 7 次 比较 。 说 明 Ford-Johnson 算 法 达到 此 下 界 。 
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2.5 
2.6 


2.7 


2.8 


2.9 
2.10 
2.11 


2.12 


证 明 ， 在 有 n 个 数 的 序列 中 找 出 最 大 的 数 至 少 需要 n 一 1 次 比较 。 

证 明 ， 找 出 个 数 的 序列 中 第 二 大 的 数 ， 至 少 需要 n-2 + [logn] 次 比较 。 

RE: 如 果 没 有 确定 最 大 数 ， 就 不 能 确定 第 二 大 的 数 。 因 此 ， 可 以 进行 下 面 的 分 析 : 
(1) 证 明 : 找 出 最 大 的 数 至 少 需要 w 一 1 次 比较 。 

(2) 证 明 ， 总 是 存在 某 个 比较 序列 ， 使 得 找到 第 二 大 数 ， 需 要 另外 的 [logn] 一 1 次 比较 。 


证 明 ， 如 果 7() = o7{ 2 +n, ABA Fao MTN) =k, H 





a-b JAN 


证 明 ， 如 果 Ta) = VaTWn)+n, Tm) =k, vn <m, ATN) = kn”? tin, 
阅读 文献 Horowitz and Sahni 1978 中 的 定理 10.5， 该 定理 的 证 明 对 找 出 下 界 提 供 了 一 种 好 方法 。 
证 明 : 对 任何 只 基于 比较 的 查找 算法 ， 二 分 查找 是 最 优 的 。 
已 知 下 面 的 函数 对 ， 使 得 第 一 个 函数 比 第 二 个 函数 大 的 最 小 的 n 值 是 多 少 ? 
(a) 2", 2r, 
(b) n'°, 2n logon, 
(c) n*, 5n?*', 


Q(n log 刀 时 间 是 对 从 1 到 C 范 围 内 的 个 整数 的 排序 问题 的 下 界 吗 ? 其 中 C 是 常数 。 为 什么 ? 


1o8gp 下 
T(n) = kal" nf b (A -1} o 
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贪心 法 (greedy method) 是 解决 某 些 优化 问题 的 一 种 策略 。 假 设 我 们 可 以 通过 一 系列 的 决 
策 来 解决 某 个 问题 。 贪 心 法 使 用 如 下 的 方法 :; 在 每 个 阶段 做 出 的 决策 都 是 局 部 最 优 的 决策 。 对 
于 某 些 问 题 ， 正 如 下 面 将 看 到 的 ， 这 些 局 部 最 优 解 将 最 终 成 为 全 局 最 优 解 。 这 里 需要 强调 的 是 
只 有 一 部 分 优化 问题 能 够 通过 贪心 法 来 解决 。 假 如 局 部 最 优 解 不 能 够 导出 全 局 最 优 解 时 ， 贪 心 
法 仍然 是 值得 推荐 的 。 就 像 在 后 面 将 会 看 到 的 ， 因 为 它 至 少 得 到 了 一 个 通常 人 们 可 接受 的 解 。 

现在 通过 一 个 例子 来 描述 贪心 法 的 本 质 。 研 究 已 知 n 个 数 的 集合 ， 要 求 从 中 选择 出 k 个 数 ， 
使 得 在 所 有 可 能 挑 出 的 k 个 数 中 ， 它 们 的 和 最 大 。 

为 解决 该 问题 ， 可 以 考查 从 "个 数 中 选择 出 个 数 的 所 有 方法 。 这 当然 是 一 种 比较 思春 的 方法 ， 
因为 可 以 挑 出 前 个 最 大 的 数 ， 它 们 就 是 问题 的 解 。 或 者 ， 可 以 用 下 面 的 算法 来 解决 该 问题 : 

For i := 1 to k do 

选择 出 最 大 的 数 ， 并 将 它 从 输入 中 删除 。 

Endfor 


上 面 的 算法 是 一 种 典型 的 贪心 方法 ， 在 每 一 步 选择 出 最 大 的 数 。 

萎 虑 另 … 种 使 用 贪心 法 的 情况 。 在 图 3-1 中 ， 要 求 找到 从 vo 到 v; 的 最 短路 径 。 对 于 该 图 ， 可 
以 通过 找 出 一 条 从 vy 到 v; , ，(i = 0，!1，2) 的 最 短路 径 来 解决 这 个 问题 。 即 首先 找到 从 vo 到 v 的 
最 短路 径 ， 然 后 找到 从 ”到 v 的 最 短路 径 ， 等 等 。 显 然 ， 最 后 将 会 得 到 最 优 解 。 





图 3-1 一 个 贪心 法 解决 问题 的 实例 


然而 ， 也 可 以 很 容易 地 给 出 一 个 使 用 贪心 法 不 能 解决 的 例子 ， 考 虑 图 3-2。 

在 图 3-2 中 ， 也 要 求 找 出 一 条 从 w 到 凡 的 最 短路 径 。 如 果 使 用 贪心 方法 ， 那 么 第 1 步 要 先 找 
出 - -条 从 w 到 某 个 结 点 的 最 短路 径 ， 选 择 结 点 w%.:。 下 一 步 要 找 出 从 w. :到 某 个 结 点 的 最 短路 径 ， 
在 第 2 步 中 选择 "> ,。 这 样 最 终 的 解 是 


Vo Vy 27 V2 1 V3 


这 条 路 径 的 总 长 度 是 1 +9 + 13 = 23, 
虽然 能 以 快速 方式 得 到 ， 但 这 个 解 并 不 是 最 优 解 。 事 实 上 ， 最 优 解 是 


Voy Vy V2 2 Vy 


它 的 总 长 度 是 3+3+ 1=7。 
我 们 将 在 后 续 的 章节 中 介绍 解决 这 个 问题 的 方法 。 
在 用 贪心 法 解决 图 3-2 所 示 的 问题 时 出 现 了 什么 错误 昵 ? 为 了 回答 这 个 问题 ， 我 们 把 思路 
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转移 到 下 棋 上 来 。 一 名 优秀 的 棋 手 决 不 会 简单 地 看 看 棋盘 就 走 一 步 在 当时 是 最 优 的 棋 ， 他 要 
“向 前 看 ”"， 即 他 要 想象 出 最 有 可 能 走 的 几 步 ， 同 时 想象 他 的 对 手 将 如 何 应 对 ， 他 一 定 也 清楚 他 
的 对 手 也 会 向 前 看 。 因 此 ， 整 个 棋局 看 起 来 如 图 3-3 所 示 的 一 棵 树 。 


第 0 步 第 1 步 第 2 步 第 3 步 











图 3-2 一 个 贪心 法 解决 不 了 的 问题 实例 图 3-3 一 棵 棋 树 


在 图 3-3 中 ， 赔 圈 表 示 一 名 棋 手 ,方块 表示 他 的 对 手 。 只 有 当 整 理 出 这 样 一 棵 棋 树 ， 才 能 
走出 聪明 的 、 正 确 的 一 步 。 考 虑 图 3-4， 这 是 
一 个 虚构 的 残局 树 。 

从 这 棵 残局 树 中 ， 能 够 依据 下 面 的 推理 
做 出 应 该 如 何 走 棋 的 决策 。 

(1) 由 于 对 手 总 是 想 让 我 们 输 ， 我 们 标 
记 1 和 K 为 LOSE ( 输 ) ， 如 果 到 达 了 其 中 任 一 
个 状态 ， 我 们 将 会 输 。 

(2) 由 于 我 们 总 是 想 赢 ， 我 们 就 把 FE 和 C 
标记 为 WIN ( 赢 )。 此 外 ， 把 有 标记 为 LOSE。 

(3) 又 由 于 对 手 总 是 想 让 我 们 输 ， 我 们 
把 5 和 C 分 别 标记 为 LOSE 和 WIN。 

(4) 由 于 我 们 想 赢 ，4 标 记 为 WIN。 

从 上 上 面 的 讨论 ， 我 们 明白 在 做 决策 的 时 
候 ， 经 常 必须 要 向 前 看 ， 然 而 贪心 法 从 来 不 
向 前 看 。 考 虑 图 3-2， 为 了 找 出 从 Vo 到 v3 的 最 短路 径 ， 也 需要 向 前 看 。 对 于 从 第 1 步 的 结 点 中 选 
出 一 个 结 点 ， 我 们 必须 知道 第 1 步 的 每 个 结 点 到 ”的 最 短路 径 。 令 d minli, DRAA i ARA 
的 最 短 距 离 ， 那 么 











图 3-4 一 棵 残局 树 


3+d min(v,,,v;) 
1+dmin(v ,,¥;) 
d min(vo, v3) = 54d min(v ,,V3) 


7+dmin(v, 4,¥3) 


现在 读者 应 该 明白 由 于 贪心 法 不 向 前 看 ， 因 此 它 不 能 得 到 最 优 解 。 在 本 章 的 剩余 部 分 中 ， 
将 展示 贪心 法 可 以 解决 的 许多 有 趣 例子 。 
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3.1 生成 最 小 生成 树 的 Kruskal 算 法 


用 贪心 法 解决 的 一 个 有 名 问题 是 最 小 生成 树 问题 (minimum spanning tree problem)。 在 本 
节 中 ， 将 介绍 生成 最 小 生成 树 的 Kruskai 方 法 〈Kruskal's method)。 最 小 生成 树 可 以 在 欧 几 里 得 
宇 间 点 上 或 在 “个 网 上 定义 。 对 于 Kruskal 方 法 ， 最 小 生成 树 是 在 图 上 定义 的 。 

定义 设 G =(V，E) 表 示 一 个 带 权 的 连通 无 向 图 ， 其 中 V 表 示 顶 点 集合 ,EE 表示 边 集合 。 

G 的 一 棵 生成 树 是 一 棵 无 向 树 S = (V, T), 

其 中 7T 是 E 的 子 集 。 生 成 树 的 权 是 7 的 所 

有 权 之 和 。G 的 最 小 生成 树 是 G 的 具有 

最 小 权 值 的 生成 树 。 

例 3-1 最 小 生成 树 

图 3-5 显 示 了 由 5 个 顶点 和 8 条 边 构成 的 
图 。 图 3-6 显 示 了 该 图 的 一 些 生成 树 。 图 3-7 
显示 了 该 图 的 … 棵 最 小 生成 树 ， 它 的 权 为 : 








50 + 80 + 60 + 70 = 260, 图 3-5 带 权 连 通 无 向 图 
O © Q O 
©) ©) 
© ©) © O) 
a) b) 
图 3-6 两 棵 生成 树 


构造 最 小 生成 树 的 Kruskal 方 法 可 以 简单 地 描述 如 下 : O O 

(1) 从 边 集 合 中 选择 一 条 具有 最 小 权 值 的 边 ， 它 将 形成 10 
初始 构造 的 部 分 子 图 ， 这 个 子 图 以 后 将 发 展 成 为 一 棵 最 小 “50 ` © 
生成 树 。 

(2) 将 次 小 权 值 的 边 加 入 这 个 构造 的 部 分 子 图 中 ， 但 必 (D) 60 


须 保证 这 个 边 的 加 入 不 会 形成 回路 ， 否 则 将 放弃 这 条 边 。 
(3) 如 果 生 成 树 包含 了 n 一 1 条 边 ， 则 终止 ， 否 则 转 到 (2)。 图 3-7 最 小 生成 树 





算法 3-1 Kruskal 最 小 生成 树 算法 
输入 : 一 个 带 权 的 连通 盛 向 图 G = (Y，E)。 
输出 :加 G 的 一 棵 最 小 生成 树 。 


了 := 中 
While T 所 含 的 边 数 少 十 n-1 do 
Begin 


从 E 中 选择 … 条 最 小 权 值 的 边 (v，w) 
ALE AMER AO, w) 
If CG. wht ATRIA RE PLE) then 
将 (v，w) 加 入 T 
Else 
KEO, w) 
End 


E aaa 
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例 3-2 Kruskal j$ 

考虑 图 3-5 中 的 无 向 图 ， 边 排序 成 如 下 顺序 : 
(A, E)(C, D)(B, C)(B, D)(A, D)(E, D) (E, B) (4, C) 
现在 构造 最 小 生成 树 ， 如 图 3-8 所 示 。 


读者 应 当 注 意 到 我 们 不 必 将 边 排序 。 实 际 上 ， “oO see 
在 2.5 节 所 介绍 的 堆 也 可 以 用 于 选择 下 一 条 最 小 权 什 l 
的 边 。 50 (A, E) 添加 
仍然 有 一 个 问题 要 解决 ， 如 何 能 有 效 地 判定 加 四 
入 的 边 是 否 形成 回路 呢 ? 这 可 以 很 容易 地 解决 。 在 
Kruskal 算 法 执行 期 间 ， 构 造 的 部 分 子 图 是 由 许多 树 Q 


分 别 表 示 为 $， = {l, 2, 3, 4} 和 5S, = {5, 6, 7, 8, 


构成 的 生成 森林 ， 因 此 可 以 将 一 棵 树 的 点 集 限制 在 30 Op 
一 个 单独 的 集合 中 。 在 图 3-9 中 有 两 棵 树 ， 它 们 可 以 O oy 
9}。 假 如 下 一 条 要 加 入 的 边 是 (3，4)。 由 于 顶点 3 和 4 (A) (8) 70 
都 在 集合 8 中 ， 这 将 形成 一 条 回路 。 所 以 边 (3 ，4) 不 50 (Cc) BO 添加 
能 加 入 。 同 样 地 ， 也 不 能 将 边 (8，9) 加 入 ， 由 于 顶点 四 oye 
8 和 9 都 在 ?9 中。 但 是 ， 可 以 加 入 边 (4，8)。 
基于 上 述 讨论 ， 我 们 明白 Kruskal 算 法 由 以 下 的 AQ Ceo anus 
步骤 所 决定 ， 50 80 © A. D) 深圳 
(1) 排序 。 这 将 花费 OUn log m) 步 ， 其 中 mm 是 图 A moe 
中 边 的 数目 。 © 闻 


(2) 两 个 集合 的 合并 。 将 两 棵 树 合并 时 ， 该 步 是 必 。 图 3.8 使 用 Kruskal 算 法 生成 一 棵 最 小 生成 树 
须 的 。 当 插入 一 条 边 连接 两 棵 子 树 时 ， 实 质 上 是 将 两 
个 集合 合并 。 例 如 ， 要 将 边 (4，8) 加 入 图 3-9 的 生成 树 中 ， 是 将 集合 1，”. 3，4} 和 1，6，7，8， 
9} 合 并 成 {1，2，3，4，5，6，7，8，9}。 因 此 ， 应 当 完 成 一 种 操作 ， 也 就 是 将 两 个 集合 合并 。 


ma © OOO 
O Y © 


图 3-9 一 个 生成 森林 


(3) 在 集合 中 找 出 一 个 元 素 。 注 意 ， 当 判定 是 否 能 够 加 入 一 条 边 的 时 候 ， 必 须 考 察 这 两 个 
顶点 是 否 在 一 个 顶点 集中 。 因 此 ， 应 当 完 成 一 种 操作 ， 称 为 查找 操作 (find operation) ， 这 个 
操作 判定 一 个 元 素 是 否 在 一 个 集合 中 。 

在 第 9 章 中 ， 将 会 证 明 合并 和 查找 操作 都 将 花费 O(m 步 。 因 此 ，Kruskal 算 法 的 总 时 间 由 排 
序 来 决定 ， 它 花费 的 时 间 为 Oon log m)。 在 最 坏 的 情况 下 ，m = 下 ， 因 此 ，Kruskal 算 法 的 时 间 
复杂 度 为 O(n? logn). 

现在 证 明 Kruskal 算 法 是 正确 的 ， 也 就 是 ， 它 产生 了 一 棵 最 小 生成 树 。 假 定 与 所 有 边 相关 
BUERT, Elele <len, HHn = IE, STE Ha Kruskal HA ERER, T 
表示 一 棵 最 小 生成 树 。 我 们 将 证 明 T = T'。 假 设 不 是 这 样 ， 令 e 是 T 中 最 小 权 值 的 边 ， 但 它 不 在 
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7 了 中。 显然 闯 1， 将 e 加 入 7 中 ， 这 必然 会 在 7 中 形成 一 条 回路 。 令 e 是 这 个 回路 中 的 一 条 边 ， 
但 它 不 是 7 中 的 边 ， 这 样 的 e 一 定 存在 。 和 否则 这 个 回路 中 所 有 的 边 都 在 7 中 ， 这 意味 着 在 7 中 有 
-个 回路 ， 而 这 是 不 可 能 的 。 有 两 种 可 能 的 情况 ， 第 一 种 情况 : ei 比 e 的 权 值 小 ， 也 就 是 /<i。 
令 了 表示 由 Kruskal 算 法 判断 e 是 否 要 加 入 之 后 所 生成 的 树 。 显 然 ， 对 于 k<i， 刀 是 7 和 7 的 子 树 ， 
这 是 由 于 已 经 假设 了 ei 是 T 中 最 小 权 值 的 边 且 不 在 T' 中 。 由 于 j<i 且 ej 不 是 T 中 的 边 ，ej 必 然 不 会 被 
Kruskal 算 法 选择 ， 这 是 由 于 将 6 加 入 到 TT, 中 会 形成 一 条 回路 。 然 而 ， 由 于 TT 也 是 7 的 一 棵 子 
树 并 且 ey 是 T 中 的 一 条 边 ， 将 ej 加 入 到 7T_, 中 不 会 形成 一 条 回路 。 因 此 ， 这 种 情况 是 不 可 能 出 现 
的 。 第 工种 情况 : e 比 e 的 权 值 大 ， 比 如 >i。 在 这 种 情况 下 ， 将 e 移 走 ， 这 将 会 产生 一 棵 新 的 
生成 树 ， 它 的 总 权 值 比 T' 小 。 因 此 ,了 必然 与 7 相同 。 

显然 Kruskal 算 法 使 用 了 贪心 方法 。 在 每 一 步 中 ， 下 一 条 将 要 加 入 的 边 都 是 局 部 最 优 的 。 
有 趣 的 是 最 终 将 会 得 到 一 个 全 局 最 优 解 。 


3.2 生成 最 小 生成 树 的 Prim 算 法 


在 3.1 节 中 已 介绍 了 找 出 最 小 生成 树 的 Kruskal 算 法 ， 在 本 节 中 ， 将 介绍 一 个 分 别 由 Dijkstra 
和 Prim 独 自发 现 的 算法 。Prim 算 法 (Prim’s algorithm) 是 一 步 步 地 建立 一 棵 最 小 生成 树 。 在 任 
何 时 候 ， 令 X 表 示 包 含 在 部 分 构成 的 最 小 生成 树 中 的 顶点 集 ， 了 = VX。 下 一 条 将 要 加 入 的 边 (u， 
v) 是 在 X 和 JuEX，vE 咏 之 间 具 有 最 小 权 值 的 边 。 此 种 情况 如 图 3-10 所 未 。 下 一 条 要 加 入 的 边 是 
(4，Vy)。 当 这 条 边 加 入 后 ， 将 v 从 Y 中 删除 并 将 其 加 入 X 中 。Prim 方 法 的 一 个 要 点 是 可 以 从 任何 
一 个 顶点 开始 ， 这 相当 方便 。 


图 3-10 Prim 方 法 的 一 个 实例 
接 下 来 ， 简 单 地 介绍 一 下 Prim 算 法 ， 稍 后 将 详细 介绍 。 


算法 3-2 找到 最 小 生成 树 的 Prim 算 法 
输入 : 带 权 的 连通 无 向 图 C = (Y，E)。 
输出 G 的 一 棵 最 小 生成 树 。 
步骤 1. 令 * 是 Y 中 任意 顶点 ， 令 X = {x}, X=V-{x}。 
步骤 2. 从 E 中 选择 -条 边 (4，v)， 使 得 4 EX,，vEY， 开 且 (x，v) 是 顶点 集 X 与 Y 之 闻 的 边 中 权 值 最 小 的 。 
步骤 3. 将 4 连接 到 y,， 令 X= XU{r}, Y= V-{v}, 
步骤 4. 如 果 Y 是 空 的 ， 那 么 终止 ， 痢 么 产生 的 树 是 最 小 生成 树 ， 和 否则， 返回 到 步骤 2。 


例 3-3 基本 的 Prim 算 法 

再 次 研究 图 3-5， 下 面 将 展示 如 何 用 Prim 算 法 生成 一 棵 生成 树 。 假 定 8 是 选择 的 初始 顶点 ， 
图 3-11 说 明了 生成 过 程 。 在 过 程 的 每 一 步 中 ， 下 一 条 将 要 加 入 的 边 都 是 最 小 地 增加 了 总 权 值 。 
例如 ， 当 部 分 构成 的 树 包含 顶点 8，C 和 D 时 ， 余 下 的 顶点 集 是 {4，E}， 连 接 {4，E} 与 {8,C， 
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D} 且 其 有 最 小 权 值 的 边 是 (4，D)}， 因 此 ，(4，D) 被 加 入 。 由 于 顶点 4 没有 包含 在 部 分 构成 的 最 
小 生成 树 中 ， 因 此 ， 这 条 边 的 加 入 将 不 会 形成 回路 。 


读者 一 定 对 是 否 可 以 从 另外 其 他 某 个 顶点 开始 感 兴趣 ， 事 实 确实 是 这 样 。 假 设 初始 从 顶点 
C 开 始 ， 图 3-12 说 明了 最 小 生成 树 的 构造 过 程 。 


部 分 构造 的 最 小 生成 树 。 ”增加 的 边 部 分 构造 的 最 小 生成 树 增加 的 边 
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图 3-11 从 顶点 8 开始 用 Prim 算 法 找 出 最 小 生成 树 


(A, E) 





图 3-12 从 顶点 C 开 始 使 用 基本 的 Prim 
算法 找 出 最 小 生成 树 

现在 证 明 Prim 算 法 是 正确 的 ， 即 生成 的 树 的 确 是 一 棵 最 小 生成 树 。 令 G = (Y， 司 表示 一 个 
带 权 的 连通 图 。 不 失 一 般 性 ， 假 定 所 有 的 边 权 值 都 不 同 。 令 7 表示 G6 的 一 棵 最 小 生成 树 ，T, 表 
示 7 的 一 棵 子 树 ， 如 图 3-13 所 示 。 令 V 表 示 T, 中 的 顶点 集 ， 且 V, = VVi， 令 (a，b) 是 E 中 其 有 最 
小 权 值 的 边 ， 使 得 aEV,，bEV,。 我 们 将 证 明 (4a，5) 一 
定 在 7 中 。 假 设 不 是 这 样 的 ， 由 于 树 是 连通 的 ， 那 么 在 
7 中 一 定 有 一 条 从 a 到 /的 路 径 。 令 (c，d 是 路 径 上 的 一 
条 边 ， 使 得 cEV,，dEV,，(c，d) 的 权 一 定 比 (4a，6b) 的 权 
大 。 因 此 ， 可 以 将 (c，d) 删 除 而 将 (a，5) 加 入 从 而 生成 
一 棵 更 小 的 生成 树 。 这 证 明了 7 一 定 不 是 一 棵 最 小 生成 
树 。 因 此 ，(a，b) 一 定 在 T 中 ，Prim 算 法 是 正确 的 。 

上 面 的 算法 只 是 Prim 算 法 的 一 个 简要 概述 。 以 这 
种 方式 表示 出 来 比较 好 理解 。 我 们 从 X = {x} 和 Y= V- 
{x} 开 始 ， 为 了 找 出 X 与 Y 之 间 最 小 权 的 边 ， 必 须 考查 所 
有 和 邻接 于 x 的 边 ， 在 最 坏 的 情况 下 ， 将 花费 4 一 1 步 ， 其 中 a 是 V 中 的 顶点 数 。 假 设 y 已 经 加 入 X 中 ， 
即 假定 X = (x, yh, Y= V-Lz， 信 ， 为 了 找到 X 与 了 之 间 最 小 权 的 边 ， 看 起 来 还 有 一 个 问题 : 是 
否 需 要 再 一 次 地 考查 所 有 依附 于 x 的 边 ? (当然 , 不 需要 考查 x 与 y 之 间 的 边 , 由 于 它们 都 在 X 中 。) 
Prim 通 过 维护 两 个 向 量 找到 了 一 个 简便 的 方法 来 避免 这 个 麻烦 。 

设 有 n 个 顶点 ， 分 别 标记 为 1，2，…，m， 并 设 有 两 个 向 量 C, 和 C:， 令 X 表 示 Prim 算 法 中 部 
分 构造 的 树 的 顶点 集 ， 且 了 = VX。 令 i 是 7 中 的 一 个 顶点 ， 在 所 有 邻接 于 X 中 顶点 与 7 中 顶点 的 





图 3-13 证 明 Prim 算 法 正确 的 最 小 生成 树 
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边 中 , Sidi, D GEX) 是 具有 最 小 权 的 边 ， 向 量 C, 和 C2: 用 于 存储 这 个 信息 ， 令 wG， 记 表示 边 
G, 万 的 权 ， 那 么 在 Prim 算 法 的 每 一 步 中 ， 

Ci) = 
A CA) = wt(i, j) 

现在 证 明 使 用 这 两 个 向 量 能 够 避免 重复 检查 边 。 不 失 一 般 性 ， 假 定 初 始 时 X = {1}, Y= {2， 
3，…， Nn}。 显 然 ， 对 于 7 中 的 每 个 顶点 i， 如 果 边 (i，1) 存 在 ， 那 么 Ci(i) = 1，C2D = wi, 1), 
最 小 的 Ci) 决定 了 下 一 个 要 加 入 X 的 顶点 。 

再 次 假定 顶点 2 是 选择 加 入 X 中 的 顶点 ， 因 此 , X={1, 2}, 了 = 3，4，…，n}。Prim 算 法 
需要 决定 X 与 了 之 间 最 小 权 值 的 边 ， 但 是 ， 在 C(D 和 C2:( 的 帮助 下 ， 不 用 再 检查 邻接 于 顶点 ;的 
边 了 。 假 定 i 是 7 中 -个 顶点 ， 如 果 w(i，2)<wli，UD， 将 CD 从 1 变 到 2， 将 CD 从 w(，D 变 到 
w(i，2)。 如 果 w(i，2) 宇 w(i，1)， 那 么 不 变 。 在 Y 中 所 有 顶点 更 新 了 之 后 ， 可 以 通过 考查 Cs() 来 
选择 加 入 到 X 中 的 顶点 ， 最 小 的 Cs(i) 决 定 了 下 一 个 要 加 入 的 顶点 。 正 如 读者 所 看 到 的 ， 现 在 已 
经 成 功 避免 了 重复 检查 所 有 的 边 ， 每 条 边 仅 检查 - -次 。 

下 面 将 详细 地 讲述 Prim 算 法 。 


算法 3-3 构造 最 小 生成 树 的 Prim 算 法 

WA: -个 带 权 连 通 无 向 多 G =V, D. 

输出 : G 的 一 棵 最 小 生成 树 。 

BHR. 令 X = dah, Ye VO}, HAV (ET, 

步骤 2. MV HET iy, BC) = < Cy) = ©, 

步骤 3. EVRA BAA GAY On, EBET. aR fey. Oe, yit iwe, 
¥) = b<Chy), HCO) =x, GAb)=b: PAURE, 

步骤 4. 今 ? 是 Y 中 的 … 个 质点 使 得 CC) 最 小 ，: = CONG 一 定 在 Xx 中 )， 在 部 分 构成 树 T7 中 ， 将 3 用 边 (Y，:) 连 接 到 :。 
AX =X44y}, Y=Y-{y}， 置 Cy) = o。 

步骤 5. 如果 Y 是 空 集 ， 那 么 终止 这 个 过 程 ， 产 生 的 树 7 是 一 棵 最 小 生成 树 ;， 否 则 ， 置 x-=y， 并 返回 步 坚 3。 


例 3-4 Prim 算 法 

考虑 图 3-14。 

”参照 图 3-15， 将 说 明 Prim 算 法 是 如 何 产生 一 棵 最 小 生成 树 的 。 首 先 假定 顶点 3 是 初始 选择 
的 。 

对 于 Prim 算 法 ， 当 一 个 顶点 加 入 到 部 分 构成 
的 树 时 ，C, 中 的 每 个 元 素 都 应 该 检查 。 因 此 ， 在 
最 坏 情 况 下 和 平均 情况 下 ，Prim 算 法 的 时 间 复 杂 
度 是 O(n”))， 其 中 nn 是 V 中 的 顶点 数 。 注 意 到 Kruskal 
算法 的 时 间 复杂 度 是 O(m log m)， 其 中 m 是 E 中 边 
数 。 在 m 较 小 的 情况 下 ，Kruskal 算 法 更 好 一 点 。 
在 最 坏 情况 下 ， 就 像 在 前 面 提 到 的 ，m 可 能 等 于 
O(n”)，Kruskal 算 法 的 时 间 复 杂 度 为 O(n”* log n), 
这 比 Prim 算 法 的 时 间 复 杂 度 大 。 图 3-14 说 明 Prim 算 法 的 图 


3.3 单 源 最 短路 径 问 题 


在 最 短路 径 问 题 (shortest path problem) 中 ， 给 定 一 个 有 向 图 G = (V，E)， 其 中 每 条 边 与 
一 个 非 负 的 权 相 关 。 这 个 权 可 以 看 作 是 该 边 的 长 度 ，G 中 的 路 径 长 度 定义 为 在 这 条 路 径 上 所 有 
的 边 长 度 之 和 。 单 源 最 短路 径 问 题 (single-source shortest path problem) 是 找 出 从 指定 的 标记 
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为 w 的 源 点 到 VY 中 所 有 其 他 顶点 各 自 的 最 短路 径 。 


CI Cc, 
x=3 1 /3\ Y l 
2 |3| Y 2 
3 X | 
4,3] Y 4 
5 \ 3) Y 5 
x= 3 1 /3Y X l 
2 |3| Y 2 
3 x 3 | 
4/3) Y 4 
5 \3) Y 5 
y=1 
x=! 1 /3\ X 1 
2 |3| Y 2 
3 | X 3 | 
4 i3] Y 4 
5 \l} X 5 
y=5 
x=5 1 /3\ X l 
2 |3| X 2 
3 X 3 | 
4 |15| Y 4 
5 \l} X 5 
y=2 
x=2 1 /3Y X 1 
2 |3] X 2 
3 13| X 3 | 
4 |5| x 4 
5 (I) X 5 





ERITA fat 


图 3-15 从 顶点 3 开始 Prim 算 法 找 出 一 棵 最 小 生成 树 
在 本 节 将 说 明 可 以 用 贪心 法 来 解决 单 源 最 短路 径 问 题 ， 这 是 由 Dijkstra 提 出 的 ， 因 此 这 个 


算法 称 为 Dijkstra 算 法 (Dijkstra’s algorithm), Dijkstra 
算法 的 思想 与 前 面 提 到 的 最 小 生成 树 算 法 思想 相似 ， 基 


Yo V2 
30 





本 的 思想 非常 简单 ， 从 w 到 所 有 其 他 顶点 的 最 短路 径 可 
以 一 个 一 个 地 找 出 。 首 先 找 出 与 w 最 近邻 顶点 的 最 短路 
径 ， 然 后 找 出 与 w 第 二 近 顶 点 的 最 短路 径 ， 这 个 过 程 一 
直 重 复 到 找 出 与 w 第 n 近 顶点 的 最 短路 径 ， 其 中 4 是 图 中 
除了 vo 以 外 的 顶点 数 。 

例 3-5 单 源 最 短路 径 问 题 

考虑 图 3-16 中 的 有 向 图 ， 找 到 所 有 从 w 出 发 的 最 短 
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图 3-16 说 明 Dijkstra 算 法 的 图 


算法 首先 确定 与 wm 最 近 的 顶点 是 w， 从 ww 到 v1 最 短 的 路 径 是 vovi。 与 w 第 二 近 的 顶点 是 w， 相 
应 的 最 短路 径 是 voviv,。 注 意 到 虽然 这 条 路 径 是 由 两 条 边 所 构成 的 ， 但 它 仍 然 比 只 包含 一 条 边 
的 vov; 短 。 与 w 第 三 和 第 四 近 的 顶点 分 别 是 vs 和 v;， 整个 ; 过 程 可 以 由 表 3-1 来 说 明 。 


表 3-1 找 出 从 vo 出 发 的 最 短路 径 举例 





t A O A UE AN 从 到 第 i 近邻 点 的 最 短路 径 (长 度 ) 
1 vi vovi (10) 

2 Va voviv (25) 

3 v; Vv Yav; (29) 

4 Vy vovv (30) 


如 同 在 最 小 生成 树 算法 中 一 样 ， 在 Dijkstra 算 法 中 也 将 顶点 集 分 成 两 个 集合 : S 和 VS， 其 
中 5 包含 所 有 与 vo 第 i 近 的 顶点 ， 这 些 顶 点 是 在 最 初 的 ; 步 内 得 到 的 。 因 此 ， 在 第 (i + 1) 步 工作 是 
找到 与 w 第 (i + 1) 近 的 顶点 。 对 于 这 点 ， 最 重要 的 是 不 能 采取 任何 不 正确 的 行动 。 参 见 图 3-17， 
图 中 表示 了 已 经 找到 了 与 ww 最 近 的 顶点 v,。 看 起 来 由 于 viv; 是 连接 5 与 Y-5 的 最 短 边 ， 应 该 选择 
vi 作为 下 一 条 边 ,v; 就 是 第 二 近 的 顶点 , 但 这 其 实 是 错误 的 。 原 因 是 要 找 从 vo 出 发 的 最 短路 径 。 
在 这 种 情况 下 ，v, 是 第 二 近 的 顶点 ， 而 不 是 v,。 
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图 3-17 两 个 顶点 集 S 和 V5 
下 面 来 说 明 用 在 Dijkstra 算 法 中 高 效 地 找 出 下 一 个 与 w 最 近 顶 点 的 一 个 重要 技巧 。 如 图 3-16 


所 示 ， 令 Cw) 表 示 当 前 找到 的 从 wm 到 v 的 最 短 距 离 。 在 最 开始 时 ，S = {vo}, 且 由 于 y, 和 v, 都 与 v。 
相连 接 ， 我 们 得 到 


L(v,)= 10 
及 Lv2) = 30 

由 于 L(Y1) 是 最 短 的 ， 因 此 ，v 是 与 ww 最 近 的 顶点 。 令 5 = {v vi}, 那么 现在 只 有 v, 和 v; 连 接 
到 5。 对 于 vy,，， 它 之 前 的 L(v,) 等 于 30。 然 而 ， 在 vi 放 入 5 之 后 ， 可 以 选用 路 径 vov1v, 了 ， 它 的 长 度 


为 10+15 = 25<30。 因 此 ， 就 v 来 说 ，L(v,)' 可 以 计算 如 下 : 
Ly) = min{L(v,), Lv) + vrf RE} 
= min{30, 10+ 15} 
= 25 
上 面 的 讨论 说 明 ， 由 于 新 加 入 的 顶点 ， 使 得 当前 找 出 的 从 w 到 "的 最 短路 径 可 能 不 够 短 。 
如 果 这 种 情况 出 现 了 ， 那 么 应 该 更 新 最 短 距离 。 
令 u 表 示 最 新 加 入 5 中 的 顶点 ，L(w) 表 示 当 前 找到 IROA v Ew RARE, cu, w) RANE eu 
和 w 的 边 长 度 ， 那 么 根据 下 面 的 公式 来 更 新 L(w): 
L(w) = min(L(w), L(u)+c(u, w)) 
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Dijkstra 算 法 解决 单 源 最 短路 径 问 题 概括 如 下 。 





算法 3-4 ”生成 单 源 最 短路 径 的 Dijkstra 算 法 


输入 : 一 个 有 向 图 G = (V，B) 及 一 个 源 点 ww， 对 十 每 条 边 (4.v) EE， 有 一 个 非 负 数字 c(w， 久 与 之 相关 ,1M = n+ 1。 
输出 ， 对 于 短 个 顶点 v EV， 得 到 从 ww 到 v 的 最 短路 徐 的 长 度 。 
S:= {v} 
For i:= | ton do 
Begin 
If (vo, vi) E E then 
ZL) := c(vp, v) 
else 
LV) = © 
End 
For į := } ton do 
Begin 
从 V-5 中 选择 4 使 L(t) 是 最 小 的 
S:=S Ulu} (* 将 4 放 到 S 中 *) 
For Y-S 的 所 有 w do 
L(w) := min(L(w), L(u) + clu, w)) 
End 





例 3-6 Dijkstra 算 法 
考虑 图 3-18 中 的 有 向 图 。 





图 3-18 一 个 带 权 有 向 图 


Dijkstra 算 法 如 下 执行 : 
(1) S= {vo} 
L(v,) = 1 
L(v,) = 6 
所 有 其 他 Lv) 都 等 于 =。 
L(v 1) 是 最 小 的 ，vov 是 从 vo 到 v 的 最短 路径 。 
S= {vo, vi} 
(2) Lv,) = min(6, L(v,) + c(y,, v2)) 
= min(6, 1 + 3) 
=4 
L(v;) = min(%, L(v,) + c(v,, v;)) 
=1+4 
=5 
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Lv.) = min(%, L(v,) + c(y,, v3)) 
=1+6 
=7 
L(y.) ee), wyviv 是 从 w 到 v 的 最 短路 径 。 
S = {Vo, Vi, V2} 
(3) L(v,) = min(5, L(v,) + cv, v3) 
= min(5, 4 + 2) 
=5 
L(va) = min(7, Lv) + c(v, v4)) 
= min(7, 4 + 2) 
=6 
Loy ABD, voviV; 是 从 ww 到 v3 的 最 短路 径 。 
S = {Voy Vis Vas V3} 
(4) L(v,) = min(6, L(v,) + cy v4)) 
= min(6, 5 + 2) 
=6 
L(y.) = min(™, L(v3) + c(v;, vs)) 
=5+3 
=8 
LV) 是 最 小 的 ，voviv2v4 是 从 vo 到 vs 的 最 短路 径 。 
S = {Vo Vi Vas Vy, Va} 
(5) L(vs) = min(8, L(v4) + c(va vs)) 
= min(8, 6 + 4) 
=8 
vovivavs 是 从 vo 到 vs 的 最 短路 径 。 
表 3-2 对 输出 做 了 总 结 。 


表 3-2 从 顶点 vo 出 发 的 最 短路 径 








项 点 从 顶点 出 发 的 最 短路 径 (长 度 ) 
vi vovi (L) 
v, vovits (1 +3 = 4) 
v; ov (1 +4 = 5) 
vy Vo V2", (1 + 3 4 2 = 6) 
Vs vovivivi (1 +4 +43 = 8) 


Dijkstra 算 法 的 时 间 复 杂 度 

很 容易 看 出 在 最 坏 的 情况 下 ， 由 于 重复 的 操作 来 计算 L(w)， 因 此 ，Dijkstra 算 法 的 时 间 复 
杂 度 是 O(n")。 从 另 一 个 角度 看 ， 由 于 每 条 边 都 要 检查 ， 解 决 单 源 最 短路 径 问 题 的 最 小 步 数 是 
Q(e)， 共 中 e 是 图 中 的 边 数 。 在 最 坏 的 情况 下 ，Q(e) = QW)。 因 此 ， 从 这 个 角度 说 ，Dijkstra 算 
法 是 最 优 的 。 
3.4 二 路 归并 问题 

已 知 两 个 有 序列 表 忆 和 已， 三 = (ai, a2, s ap), L= (b bn, 0, bn), 应 用 下 面 所 述 








的 线性 归并 算法 (linear merge algorithm) 可 以 将 已 和 万 合 并 为 一 个 有 序 的 列表 。 
算法 3-5 线性 归并 算法 


输入 : 两 个 有 序列 表 ， L = (ay, Gy, 05 a, VEIL, = (by, ba, oy brn )o 
输出 : HHL AL CAS TAL RAY AF 
Begin 
i:=] 
j=l 
do 
比较 < Mb, 
if ci >b, then fmitb,, JFAY s+ | 
else faha, Je fliveit 1 
while (i < = n, and j < = m) 
if i>a, then 输出 bj,， bai ty On 
elsefMMitta;, disi cs Gyo 
End 





很 容易 看 出 ， 在 最 坏 情 况 下 需要 比较 的 次 数 为 m + n 一 1。 当 m 和 n 相 等 时 ， 可 以 证 明 线 性 归 
并 算法 的 比较 次 数 是 最 优 的 。 如 果 要 归并 两 个 以 上 的 有 序 表 ， 可 以 用 线性 归并 算法 ， 只 需要 分 
别 重复 地 归并 两 个 有 序 表 。 这 些 归 并 过 程 称 为 二 路 归并 (2-way merge)。 由 于 每 一 步 只 归并 两 
个 有 序 表 ， Becta men 上 和 L;， 分 别 由 50，30 和 10 个 元 素 组 成 ， 可 以 将 Li 和 攻 归 
并 形成 L,， 在 最 坏 的 情况 下 ， 这 个 归并 步骤 需要 50 + 30-1 = 79 次 比较 ， 然 后 通过 80 + 10-1 = 
SOK EERE LANL VIF. 这 个 归并 序列 中 需要 比较 的 次 数 为 168。 也 可 以 先 归并 LL 和 L;， 再 归并 
L,， 那 么 只 需要 比较 的 次 数 128。 有 许多 不 同 的 归并 序列 ， 分 别 需 要 不 同 的 比较 次 数 。 现 在 关 
心 下 面 的 问题 ， 有 mm 个 有 序 表 ， 每 个 表 有 mm 个 元 素 ， 那 么 哪 一 个 归并 序列 是 最 优 的 归并 过 程 ， 
能 够 用 最 少 的 比较 次 数 将 这 些 有 序 表 归 并 ? 

为 了 简化 讨论 ， 下 面 用 n + m， 而 不 是 4 + m 一 1， 作 为 大 小 分 别 为 x: 和 mm 的 表 归 并 所 需要 的 比 
较 次 数 ， 这 显然 不 会 影响 算法 设计 。 看 一 个 例子 ， 有 大 小 为 (20，5，8，7，4) 的 五 个 有 序 表 (Li， 
Lz, Ly, La, Ls). 假设 按 如 下 方式 归并 这 些 表 : 

将 Li 与 ;归并 产生 Z!/， 需 要 20 + 5 = 25 次 比较 

将 Zi 与 归并 产生 Z,， 需 要 25 + 8 = 33 次 比较 

将 蕊 与 归并 产生 Z;， 需 要 33 + 7 = 40 次 比较 

将 与 5 归并 产生 Z4， 需 要 40 + 4 = 44 次 比较 

总 数 = 142 次 比较 
这 个 归并 方式 可 以 很 容易 地 用 一 棵 二 又 树 表示 ， 如 图 3-19a 所 示 。 

令 4 表示 二 叉 树 一 个 叶子 节点 的 深度 ， 挛 表示 与 这 个 叶子 节点 相关 的 表 的 大 小 ， 那 么 相 


应 于 这 个 归并 过 程 总 的 比较 次 数 可 以 简单 地 记 为 六 dm 。 在 我 们 的 例子 中 , di = d, =4, d;=3， 


ds = 2 及 d; = 1。 因 此 ， 总 的 比较 次 数 可 以 计算 为 4* 20+4.:5+3.:8+2.:7+1:4=80+20+ 
24+14+4= 142， 这 是 正确 的 。 

假设 用 贪心 法 ， 总 是 将 当前 两 个 最 短 的 表 归 并 ， 那 么 ， 归 并 方式 为 

TL, 与 上 ;归并 产生 ZI ， 需 要 5 + 4 = 9 次 比较 

将 石 与 归并 产生 ZZ， 需要 8 + 7 = 15 次 比较 

将 Zi 与 乙 归 并 产生 Z ， 需 要 9 + 15 = 24 次 比较 

将 已 与 与 归并 产生 已 ， 需 要 24 + 20 = 44 次 比较 
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总 数 = 92 次 比较 
上 面 的 归并 过 程 以 一 棵 二 叉 树 的 形式 表示 出 来 ， 如 图 3-19b 所 示 。 



































图 3-19 不 同 的 归并 序列 


可 以 再 次 使 用 公式 San, 在 这 个 例子 中 di = 1，d; = d;= ds= ds =3， 总 的 比较 次 数 可 以 


计算 为 ! 20 + 3 (5+4+8+7)=20+3.24=92， 这 比 图 3-19a 中 的 比较 次 数 小 。 
用 贪心 法 找到 最 优 二 路 归并 树 描 述 如 下 : 


算法 3-6 贪心 法 生成 最 优 二 路 归并 树 
RA. MPAA. La isd, 2. 7. m, HER HAT ERAUR. 
输出 : dee UR ERE. 
步骤 1. 生成 1 棵 树 ， 其 中 每 棵 树 都 只 有 一 个 权 为 n 的 结 点 (外 部 结 点 )。 
步骤 2. VEEN PRL A Re DAT) ANT, 
PRS R PORTA. KRAI TREAT AIT, BOAT AT AHA. 
步骤 4. TERT HT. 
步骤 5. AEUR PRA, BAPE ih, deel, AUE, 





例 3-7 

有 6 个 有 序 表 ， 长 度 分 别 为 2，3，5，7，11 和 13 。 找 出 一 棵 对 于 这 些 表 来 说 具有 最 小 权 路 
径 长 度 的 扩展 二 叉 树 。 

首先 将 2 和 3 归并 ， 然 后 寻找 将 5 个 长 度 为 5，5，7，11 和 13 的 有 序 表 归 并 成 问题 解 的 方法 ， 
接着 将 35 和 5 归并 ， 等 等 。 归 并 序列 如 图 3-20 所 示 。 

为 了 证 明 上 述 贪心 法 的 正确 性 ， 首 先 证 明 存在 一 棵 最 优 二 路 归并 树 ， 其 中 具有 最 小 值 的 两 
个 叶子 结 点 安排 为 兄弟 。 令 4 表示 与 根 结 点 距离 最 大 的 内 部 结 点 。 比 如 ， 在 图 3-20 中 标记 为 5 的 
” 结 点 就 是 这 样 … 个 结 点 。A 的 孩子 L, 和 一 定 是 叶子 结 点 。 假 如 A 的 孩子 的 大 小 为 和 ny。 如 果 
Fin, 不 是 两 个 最 小 的 ， 那 么 可 以 将 和 与 两 个 最 小 的 结 点 交换 而 不 增加 二 路 归并 树 的 权 。 因 
此 ， 可 以 得 到 一 棵 最 优 二 路 归并 树 ， 其 中 两 个 最 小 的 叶子 结 点 分 配 为 兄弟 。 

基于 以 上 讨论 ， 可 以 假定 7 是 Li1，L,，…，L 上 ,的 一 棵 最 优 二 路 归并 树 ，L,， 上 ,，…， 工 ,分 别 
BAKEN, n, e, hpo PRIE, nme <n, APRA RK EW TRL AL E 
TA, SARL 和 上 的 双亲 ，T 表 示 一 棵 树 ， 其 中 4 被 一 个 长 度 为 n, + BRS. SWOR 











示 二 路 归并 树 X 的 权 ， 那 么 有 
W(T) = W(T,) +n +n, (3-1) 








ao 回 & 加 回 
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图 3-20 最 优 二 路 归并 序列 


现在 通过 归纳 法 证 明 贪心 法 的 正确 性 。 显 然 对 于 mm = 2， 这 个 算法 产生 了 一 棵 最 优 二 路 归 
并 树 。 现 在 ， 假 如 对 于 m 一 1 个 表 ， 这 个 算法 产生 了 一 棵 最 优 二 路 归并 
树 。 对 于 包含 m 个 表 Li，L,，…，L, 的 例子 ， 可 以 先 将 两 个 表 L, 和 二 合 
并 ， 然 后 将 这 个 算法 应 用 到 有 m1 个 表 的 实例 上 ， 将 由 这 个 算法 产生 
的 最 优 二 路 归并 树 记 为 T,。 在 T; 中 ， 有 一 个 长 度 为 4, + n; 的 叶子 结 点 ， 
将 这 个 结 点 分 开 生 成 两 个 孩子 L, 和 L,， 分 别 具 有 长 度 n, 和 n,， 如 图 3-21 





所 示 ， 将 这 棵 新 生成 的 树 标记 为 7,， 得 到 图 321 RTH 
W(T,) = W(T,) +1, +n, (3-2) 
BURT BL), Ly, s Lyf PERIGEE. PEA RGAE, BBL 
WT)>W(D 
这 意味 着 
W(T,)>W(T,) 


然而 这 是 不 可 能 的 ， 由 于 根据 归纳 假设 ， 刀 是 m-1! 个 表 的 最 优 二 路 归并 树 。 
贪心 法 生成 一 棵 最 优 二 路 归并 树 的 时 间 复 杂 度 

对 丁 给 定 的 m 个 数字 ny ，n，,，…，n,， 可 以 构造 一 个 小 堆 表 示 这 些 数 ， 其 中 根 结 点 的 值 比 
它 孩 子 的 值 小 。 然 后 ， 将 具有 最 小 值 的 根 结 点 移 去 后 ， 重 新 生成 一 棵 树 能 够 在 O(log ) 时 间 内 
完成 ， 将 一 个 结 点 插入 到 这 个 小 堆 中 也 可 以 在 O(log nn) 时 间 内 完成 。 由 于 主 循 环 执行 了 x-1 次 ， 
那么 生成 一 棵 最 优 扩展 二 又 树 所 花费 的 总 时 间 为 O(n log n), 
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例 3-8 HARB (Huffman) 编码 

考虑 个 电信 中 的 问题 ， 用 0 和 1 序列 表示 一 组 消息 。 因 此 ， 要 发 送 一 个 消息 ， 仅 需要 传送 
- 串 0 与 1 序列 。 县 有 最 优 的 带 权 外 部 路 径 长 度 (optimal weighted external path length) 的 扩展 
“又 树 (extended binary tree) 是 生成 最 优 编码 集 的 应 
用 ， 即 这 些 信息 的 二 进 制 串 。 假 定 有 7 段 消 息 ， 它 们 
的 访问 频率 为 2，3，5，8，13，15 和 18。 为 了 最 小 化 
传送 和 解码 的 代价 ， 可 以 用 短 的 串 表 示 使 用 频繁 的 消 
息 ， 那 么 ， 可 以 先 将 2 和 3 合并 ， 然 后 是 5 和 5 等 等 ， 生 
成 一 棵 最 优 扩 展 二 又 树 ， 产 生 的 扩展 二 又 树 如 图 3-22 
所 示 。 

相应 于 使 用 频率 为 2，3，5，8，13，15 和 18 的 消 
息 编码 分 别 为 10100，10101，1011，100，00，01 和 
11， 频 繁 使 用 的 消息 编码 较 短 。 


3.5 用 贪心 法 解决 最 小 圈 基 问题 


在 这 一 节 中 ， 将 介绍 最 小 圈 基 问题 (minimum 
cycle basis problem)， 同 时 将 说 明 如 何 使 用 贪心 法 解 
决 这 个 问题 。 图 3-22 赫 夫 曼 编码 树 

参见 图 3-23， 在 这 个 无 向 图 中 有 三 个 圈 ， 分 别 为 {ab, bc, ca}, {ac, cd, da} 和 {ab, bec， 
cd, da}, 

通过 适当 的 操作 ， 可 以 将 两 个 圈 合 并 成 另 一 个 圈 。 这 个 
操作 是 环 和 操作 (ring sum operation) ， 定 义 如 下 : 令 4 和 8 是 
FAA, BRAC = AOB = (4UB)-(4nB) 是 -个 圈 。 对 于 上 述 
情况 的 圈 ， 邻 

A,={ab, bc, ca} 

A,= {ac, cd, da} 

和 A,={ab, bc, cd, da} 图 3-23 由 图 构 成 的 图 

可 以 很 容易 证 明 

A, =A, @ A) 

A, =A, © A, 

All A, =A, @A, 

这 个 例子 说 明 {4,，4，{4，4 和 {42，43} 都 可 以 认为 是 图 3-23 中 图 的 圈 基 ， 因 为 对 于 
每 个 圈 基 ， 用 它 可 以 生成 图 中 所 有 的 圈 。 正 式 的 定义 为 : 一 个 图 的 圈 基 是 图 的 集合 ， 使 得 对 力 
基 集 合 中 的 某 些 园 应 用 环 和 操作 就 可 以 生成 图 中 任何 一 个 图 。 

假如 每 条 边 与 一 个 权 相 关 ， 圈 的 权 是 这 个 圈 中 所 有 边 的 权 之 和 。 图 基 的 权 是 这 个 图 基 中 所 
有 图 的 权 之 和 。 带 权 的 圈 基 问题 (weighted cycle basis problem) 定义 如 下 : 给 定 一 个 图 ， 找 到 
这 个 图 的 最 小 图 基 。 对 于 图 3-23， 最 小 的 圈 基 是 {4,，4}， 它 具有 最 小 的 权 。 

贪心 法 解决 最 小 圈 基 问题 基于 如 下 思想 : 

(1) 我 们 能 够 确定 最 小 圈 基 的 规模 ， 用 K 表 示 。 

(2) 假设 能 够 找到 所 有 的 圈 (在 一 个 图 中 找到 所 有 的 圈 决 不 简单 ， 但 是 这 与 该 问题 不 相关 ， 
在 这 里 不 讨论 这 个 技术 。) 根据 它们 的 权 将 所 有 的 圈 排 序 成 为 一 个 非 递减 序列 。 

(3) 从 围 的 有 序 序列 中 ， 一 个 一 个 地 将 圈 加 入 到 圈 基 中 。 对 于 每 一 个 加 入 的 圈 ， 检 查 它 是 















































否 已 经 存在 于 部 分 构成 的 圈 基 中 的 一 些 圈 的 线性 组 合 。 如 果 是 ， 那 么 删除 这 个 圈 。 

(4) 如 果 在 圈 基 中 有 K 个 圈 ， 那 么 停止 。 

上 述 贪心 法 是 一 个 典型 的 贪心 策略 。 假 设想 找到 一 组 最 小 化 某 个 参数 的 对 象 集 ， 有 时 我 们 
能 确定 这 个 集合 的 最 小 规模 K， 然 后 用 贪心 法 将 对 象 一 个 一 个 地 加 入 这 个 集合 中 ， 直 到 集合 的 
规模 成 为 kK 为止。 在 下 一 节 中 ， 将 举 出 另 一 个 使 用 相同 贪心 法 的 例子 。 

现在 加 到 原始 问题 。 首 先 证 明 能 够 确定 最 小 圈 基 的 规模 。 我 们 不 给 出 正式 的 证 明 ， 相反 地 ， 
通过 一 个 例子 来 非 正式 地 解释 这 个 概念 。 参 见 图 3-24， 假 如 构 
造 这 个 图 的 一 棵 生成 树 ， 如 图 3-25a 所 示 。 这 棵 生成 树 没 有 圈 ， 
然而 ， 如 果 将 一 条 边 加 入 这 棵 生成 树 中 ， 那 么 会 形成 一 个 圈 ， 
如 图 3-25b 所 示 。 

实际 上 ， 正 如 图 3-25 所 示 ， 每 加 入 一 条 边 都 会 生成 一 个 新 
的 独立 圈 ， 独 立 的 圈 数 目 等 于 能 够 加 入 生成 树 中 的 边 数目 。 由 
于 生成 树 中 边 的 数目 是 II-1， 因 此 ， 能 够 加 入 的 边 总 数 等 于 

IEI-(IVI-1) = IEI-IVi + 1 












a) b) c) d) 
图 3-25 生成 树 和 图 的 关系 


我 们 已 经 证 明了 找到 最 小 圈 基 规模 的 公式 ， 剩 下 的 唯一 问题 是 判定 一 个 圈 是 否 圈 基 的 线性 
组 合 。 在 这 不 用 形式 化 的 方法 ， 仅 通过 一 个 例子 来 描述 该 技 
术 。 判 定 过 程 可 以 通过 用 一 个 邻接 矩阵 (incidence matrix) 表 
示 圈 来 完成 。 每 行 对 应 一 个 圈 ， 每 列 对 应 一 条 边 。 独 立 还 是 
不 独立 的 判定 可 以 通过 除去 每 个 包含 两 行 高 斯 消除 法 
(Gaussian elimination) 的 操作 来 完成 ， 这 些 操 作 可 以 是 环 和 
( 异 或 (exclusive-or)) 操作 。 现 在 通过 一 个 例子 来 说 明 这 个 
问题 ， 参 见 图 3-26。 有 三 个 园 C = {e1, e2, C3}, Cr = les, eas 
e}，C; = {e1/，e2，es，e4}， 表 示 前 两 个 圈 的 矩阵 如 下 : 图 3-26 说 明 圈 的 独立 性 检验 的 图 
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如 果 将 C3 加 入 ， 和 矩阵 变 为 如 下 形式 : 
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作用 于 第 ! 行 与 第 3 行 的 异 或 操作 产生 如 下 年 阵 : 
e €, e, el es 
cil tot 
C, 1 1 4 
C, 1 1 ł 
作用 下 C: 和 C, 的 异 或 操作 生成 一 个 空 行 ， 说 明 C ,是 C 与 C: 的 线性 组 合 。 
现在 通过 考察 图 3-27 来 完成 讨论 ， 假 定 每 条 边 的 权 为 1， 共 有 六 个 圈 表 示 如 下 : 
CE {ey es, es} C8 
C,= {e;, es, es} 
C, = {es, Es, 4, eI} 
Cy= fen, C7, Cay est “7 


Cy = {es, Cg, C7, Cas Cad 

Cy = {es, Eg, Cry Cos Egs C1} 

et Tk ew, IE) = 8, IVI = 6， 因 此, K= 
8 一 6 + 【=3。 贪 心 法 执行 过 程 如 下 : 

(DC 被 加 入 。 

(2) CHMA. 

(3) Cs 被 加 入 然后 被 舍弃 ， 由 于 发 现 C: 是 Ci 与 C, 的 线性 组 合 。 

(4) Cs 被 加入。 这 是 由 于 围 基 现 在 已 经 有 三 个 圈 ，K = 3 就 停止 ， 因 此 最 小 图 基 是 {C1，C,，Cs}。 


3.6 用 贪心 法 解决 2 终端 一 对 多 问题 


在 超大 规模 集成 电路 (VLSI) 的 设计 中 ， 有 一 种 线路 布线 问题 (channel routing problem), 
这 样 的 问题 有 许多 种 情况 ， 在 第 5$ 章 中 将 介绍 一 个 能 够 用 4* 算 法 方法 (A* algorithm method) 
解决 的 线路 布线 问题 。 本 节 讨 论 的 线路 布线 问题 是 一 般 布线 问题 的 相当 简化 的 版 本 ， 所 谓 的 2 
终端 一 对 多 问题 (2-terminal one to any problem) 将 会 在 下 面 清楚 地 解释 。 

参见 图 3-28 ， 其 中 有 几 个 终端 做 了 标记 ， 每 个 做 了 标记 的 上 面 一 行 终端 都 必须 以 一 一 对 应 
的 方式 连接 到 做 了 标记 的 下 面 一 行 的 终端 ， 并 且 要 求 任何 两 条 线 都 不 能 交叉 。 此 外 ， 所 有 的 线 
或 者 垂直 或 者 水 平 ， 每 一 条 水 平 线 对 应 于 一 条 线路 。 








图 3-27 说 明 找 到 最 小 圈 基 过 程 的 图 
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A A A A A A A A A A A 


图 3-28 2 终端 -对 多 问题 举例 


对 于 则 一 问题 可 能 有 好 几 种 解决 方案 ， 在 图 3-29 中 ， 列 出 了 图 3-28 中 间 题 的 两 种 可 行 解 。 
可 以 看 出 图 3-29a 中 的 方案 比 图 3-29 b 中 的 解 用 更 少 的 路 径 。 

对 于 - -个 实际 的 线路 布线 问题 ， 当 然 想 将 线路 数目 最 小 化 ， 在 这 个 简单 的 例子 中 ， 只 是 试 
图 将 解 的 密度 (density of a solution) 最 小 化 。 
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P | 4 | | F lo t 
路 径 1 
路 径 2 
路 径 3 
路 径 4 
路 径 5 
路 径 6 
路 答 7 
Q 1 | 全 一 一 一 二 一 J 一 J 一 
1 2 3 4 5 6 7 8 9 10 H R B 
A A A A A A A A A A A A 
b) 


图 3-29 图 3-28 中 问题 实例 的 两 种 可 行 解 


为 了 解释 密度 的 含义 ， 重 画图 3-29 中 的 两 种 解 (如 图 3-30 所 示 )。 假 设 用 一 条 垂 线 从 左 向 
右 扫描 ， 那 么 垂 线 要 与 方案 中 的 线 相交 。 在 每 个 点 上 ， 解 的 局 部 密度 (local density) 是 与 垂 
线 相交 的 线 数目 。 

比如 ， 如 图 3-30b 所 示 ， 在 终端 7 的 垂直 线 与 4 条 线 相交 ， 因 此 ， 在 图 3-30b 中 ， 解 在 终端 7 
的 局 部 密度 是 4。 解 的 密度 是 最 大 的 局 部 密度 。 很 容易 看 出 图 3-30a、b 中 解 的 密度 分 别 是 1 和 4。 
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b) 
图 3-30 重 画 图 3-29 
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为 什么 使 用 密度 作为 要 最 小 化 的 参数 呢 ? 答案 很 简单 : 这 将 使 问题 简化 。 如 果 用 路 径 数目 
作为 参数 ， 那 么 问题 将 变 得 更 加 复杂 而 难以 解决 。 另 一 方面 ， 密 度 是 路 径 数 的 下 界 ， 因 此 ， 可 
以 用 密度 作为 算法 优良 程度 的 标识 。 

可 以 使 用 上 一 节 解 决 最 小 圈 基 问题 的 方法 来 找到 具有 最 小 密度 的 解 ， 即 要 有 一 个 方法 来 确 
定 问题 实例 的 最 小 密度 。 一 旦 最 小 密度 被 确定 了 ， 就 可 以 使 用 贪心 法 找到 具有 最 小 密度 的 解 。 
在 这 里 不 讨论 如 何 确定 最 小 密度 ， 因 为 它 非常 复杂 而 且 与 所 讨论 的 贪心 法 无 关 。 我 们 讨论 的 重 
点 是 证 明 贪 心 法 总 是 可 以 找到 具有 最 小 密度 的 解 。 

现在 说 明 贪 心 法 如 何 完成 这 个 任务 。 给 定 一 个 问题 实例 ， 其 中 已 经 确定 了 它 的 最 小 密度 ， 
对 于 图 3-28 中 的 例子 ， 最 小 密度 是 1。 

令 上 面 -一 行 的 终端 标记 为 P|，P;，…，P,， 下 面 一 行 要 连接 的 终端 标记 为 G1,，Q;，…，Q,， 
m>n, 进一步 假定 Pj 和 0 都 是 从 左 向 右 标记 的 ， thE, ARI, MAP(Q)EP (OQ) NAW. 

已 知 最 小 密度 4 和 上 面 的 标记 方法 ， 贪 心 法 的 使 用 如 下 : 

(1) 将 已 连接 到 。 

(2) 在 已 连接 到 C 之 后 ， 考 察 忆 ,是 否 可 以 连接 到 @ .,， 如 果 连 接 己 ,到 @ , 的 线 将 密度 增 
加 到 d+ 1， 那么 就 尝试 将 P; ,连接 到 Q,, ,。 

(3) 重复 以 上 过 程 直 到 所 有 的 已 都 被 连接 。 

下 面 通 过 将 贪心 法 应 用 到 图 3-28 中 的 例子 来 说 明 如 何 使 用 这 种 方法 。 首 先 确定 d = 1， 由 于 
这 个 信息 ， 终 端的 连接 方式 如 图 3-31 所 示 。 注 意 到 Ps 不 能 连接 到 0Q,，，0Q;3 和 Qs 上 ， 因 为 这 样 的 连 
接 会 将 密度 增加 到 2， 这 超过 最 小 密度 。 类 似 地 ， 共 二 同样 的 原因 也 不 能 将 P, 连 接 到 8。 








A A A A A A A 
I 2 3 4 5 6 了 8 9 10 11 12 13 
P Lodo L | \ / 
g TOOT TOT T 
1 2 3 4 5 6 7 8 9 10 11 12 13 
A A A A A A AA A A A A 


图 3-31 用 贪心 法 解决 图 3-28 中 的 问题 实例 
注意 到 算法 将 不 会 产生 使 连接 终端 的 线段 相交 的 解 ， 如 图 3-32 所 示 。 实 际 上 ， 可 以 很 容 


易 地 看 出 不 会 出 现 这 样 的 连接 ， 由 于 可 以 将 这 样 的 连接 转化 为 更 小 的 或 相等 密度 的 连接 ， 如 
图 3-33 所 示 。 














P, Py P, P, 
Q, Q Qı Q2 
图 3-32 交叉 连接 图 3-33 从 图 3-32 的 交叉 连接 转换 得 到 的 连接 


最 后 ， 将 证 明 贪心 法 用 来 解决 问题 。 由 于 假设 最 小 密度 为 4， 那 么 存在 一 个 可 行 的 解 3， 
即 ((P;，Q,)，(P2，Q2)，…，(P,，Q,))， 它 的 密度 为 4。 将 证 明 这 个 解 能 够 用 贪心 法 转化 为 解 
3 ， 即 ((P， Qi)» (Po, Qa)» e (Pas Q;)), 下 面 通过 归纳 法 来 证 明 。 

假设 在 5, 中 最 初 的 x 个 连接 能 够 转化 为 5, 中 最 初 的 个 连接 ， 并 且 保 证 密度 为 4， 然 后 证 明 这 
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个 转化 对 上 = k + 1 也 一 样 能 完成 。 这 个 假设 对 上 = 1 显然 是 真 的 。 如 果 对 于 k 是 真 的 ， 那 么 就 得 到 
一 个 部 分 解 ((P,， Q), (Pz, Qa)» en (Py, QD), 并 且 保 证 密度 为 d。 考虑 Pi , ， TES PP, 3 
接 到 了 Q;,,， 假 设 在 Qj , ,的 左边 有 一 个 终端 Qj ,,， 在 保证 最 小 密度 为 4 的 条 件 下 可 以 将 它 连接 
到 Pi ,|,， 那 么 将 Pi , ,连接 到 这 个 终端 EE， 这 就 是 用 贪心 法 所 获得 的 结果 。 假 设 不 存在 这 样 一 个 
终端 ， 那 么 用 贪心 法 也 可 以 将 Pi ,连接 到 Q; |b. 

上 面 的 讨论 证 明了 任何 可 行 解 都 可 以 用 贪心 法 转化 为 另 一 种 解 ， 因 此 贪心 法 可 以 解决 该 
问题 。 

在 用 贪心 法 的 最 后 一 个 例子 中 ， 决 定 要 优化 的 参数 最 小 值 ， 然 后 用 贪心 法 直接 达到 这 个 目 
标 。 在 圈 基 问题 中 ， 将 圈 逐 个 加 入 直到 获得 了 圈 基 的 最 小 值 。 在 2 终端 一 对 多 问题 中 ， 首 先 计 
算 最 小 密度 ， 然 后 用 贪心 法 将 终端 连接 起 来 ， 任 何 时 候 算法 都 确保 产生 的 密度 不 超过 d。 


3.7 用 贪心 法 解决 1 螺旋 多 边 形 最 小 合作 警卫 问题 


最 小 合作 警卫 问题 (minimum cooperative guards problem) 是 艺术 陈列 馆 问题 的 一 种 变形 ， 
其 定义 如 下 : 给 定 一 个 多 边 形 ， 它 表示 一 个 艺术 陈列 馆 ， 要 求 安排 最 小 数目 的 警卫 ， 使 得 多 边 
形 中 每 一 个 点 至 少 可 以 被 一 名 警卫 看 到 。 例 如 ， 参 见 图 3-34 中 的 例子 ， 对 于 这 个 多 边 形 ， 需 要 
警卫 的 最 小 数目 为 2， 艺 术 陈 列 馆 问 题 是 一 个 NP 难 问题 。 

最 小 合作 警卫 问题 对 艺术 陈列 馆 问 题 增 加 了 更 多 的 限制 ， 注 意 到 如 果 一 名 警卫 安置 在 艺术 
陈列 馆 中 不 被 别 的 警卫 看 到 的 地 方 ， 这 是 非常 危险 的 。 我 们 通过 警卫 的 可 视图 (visibility 
graph) G 来 表示 它们 之 间 的 关系 。 在 G 中 ， 每 一 名 警卫 用 一 个 顶点 表示 ， 当 且 仅 当 相 应 的 两 个 
警卫 能 看 到 对 方 时 他 们 之 间 有 一 条 边 。 除 了 找到 能 够 监视 整个 多 边 形 的 最 少 警卫 外 ， 还 要 求 这 
些 警卫 的 可 视图 是 连通 的 。 换 句 话 说， 没有 一 名 警卫 是 孤立 的 ， 在 每 一 对 警卫 之 间 都 有 一 条 路 
径 ， 称 这 样 的 问题 为 最 小 合作 警卫 问题 。 

再 次 考虑 图 3-34， 相 应 于 两 名 警卫 的 可 视图 显然 是 两 个 孤立 顶点 的 集合 。 为 了 满足 最 小 合 
作 警 卫 问 题 的 要 求 ， 必 须 再 安排 一 名 警卫 ， 如 图 3-35 所 示 。 

可 以 再 次 证 明 最 小 合作 警卫 问题 是 NP 难 的 。 因 此 ， 在 一 般 多 边 形 上 的 任何 多 项 式 算法 都 
不 可 能 解决 该 最 小 合作 警卫 问题 。 但 是 可 以 证 明 用 贪心 法 可 以 解决 具有 1 螺旋 多 边 形 (1-spiral 
polygon) 形式 的 此 问题 。 


图 3-35 对 于 图 3-34 中 多 边 形 的 最 小 合作 
图 3-34 艺术 陈列 馆 问 题 的 解决 方案 警卫 问题 的 解决 方案 
在 定义 1 螺旋 多 边 形 之 前 ， 首 先 定义 反射 ( 凸 反 射 ) BE (reflex (convex) chain) 。 一 个 简 
单 多 边 形 的 反射 (是 反射 ) 链表 示 为 RC(CC)， 它 是 这 个 多 边 形 边 的 链 ， 这 个 链 满足 链 上 的 所 
有 的 顶点 都 是 多 边 形 的 内 部 号 反 射 。 我 们 保证 反射 链表 示 最 大 的 反射 链 ， 即 它 不 包含 在 其 他 任 
何 反 射 链 中 。 一 个 1 螺旋 多 边 形 P 是 一 个 简单 多 边 形 ， 它 的 边界 能 够 分 割 成 一 个 反射 链 和 一 个 凸 
反射 链 ， 图 3-36 描 述 了 一 个 典型 的 1 螺旋 多 边 形 。 
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PIF 


逆 时 针 人 遍历 1 螺 旋 多 边 形 边界 ， 称 反射 链 的 开始 (结束 ) 顶点 为 v.(v,)。 已 知 v, 和 v。.， 可 以 定 
义 两 个 区 域 ， 称 为 开始 区 域 (starting region) 和 结束 区 
域 (ending region) 。 从 v(vJ 开 始 ， 沿 着 反射 链 的 第 一 条 
(最 后 一 条 ) 边 画 一 条 线 ， 直 到 这 条 线 与 多 边 形 的 边界 
相交 于 00r)。 线 段 vvn) 和 从 v,(v,) 出 发 的 凸 链 的 第 一 
个 (最 后 一 个 ) 部 分 形成 一 个 区 域 ， 称 为 开始 (结束 ) 
区 域 。 图 3-37 举 了 两 个 例子 ， 注 意 到 开始 和 结束 区 域 可 
能 重 人 县 ， 必 须 在 开始 区 域 和 结束 区 域 各 安排 一 名 警卫 。 

贪心 法 解决 1 螺旋 多 边 形 最 小 合作 警卫 问题 如 下 所 
示 。 首 先 把 一 名 警卫 放 到 1 ， 然 后 ， 问 这 个 警卫 能 看 到 图 3-36 典型 的 1 螺旋 多 边 形 
多 大 面积 ”这 个 问题 可 以 通过 画 一 条 RC 的 切线 来 解决 ， 这 条 切线 从 l, 开 始 与 CC 相交 于 1,， 将 一 
名 警卫 放 到 已 ， 这 是 相当 有 道理 的 。 注 意 到 如 果 lL 的 左边 没有 警卫 ， 那 么 生成 的 可 视图 将 不 
连通 。 重 复 这 个 过 程 直至 到 达 结 束 区 域 。 图 3-38 显 示 一 个 典型 的 例子 ， 在 图 中 1 ，1,，L，4s 和 1/s 
点 的 警卫 构成 了 最 小 合作 警卫 问题 的 最 优 解 。 


BECC 







肥 射 链 RC > 





凸 链 CC r, 上 西 链 CC 
l 





开始 区 域 ”结束 区 域 
a) b) 


图 3-37 1 螺旋 多 边 形 的 开始 和 结束 区 域 


在 给 出 正式 算法 前 ， 必 须 定义 一 些 新 的 术语 。 参 见 图 3-39， 令 a 是 1 螺旋 多 边 形 P 内 的 一 点 ， 
可 以 画 出 从 顶点 a 出 发 的 RC 的 两 条 切线 。 如 果 RC 的 外 部 完全 位 于 从 a 出 发 的 切线 的 右边 (左边 )， 
就 称 它 为 关于 RC 的 a 的 左 ( 右 ) 切线 (left (right) tangent) 。 画 一 条 关于 RC 的 的 左 (A) 切 
线 直 到 它 与 P 的 边界 相交 于 点 b(b')， 那 么 ab(ab') 称 为 关于 a 的 左 (E) 支撑 线段 (left(right) 
supporting line segment)。 在 图 3-39 中 说 明 。 如 果 点 a 在 开始 (结束) 区 域 ， 那 么 定义 关于 a 的 
H (E) 支撑 线段 为 ov,(av.)。 





Parae 图 3-39 关于 a 的 左 和 右 支撑 线段 
ts tf2， hs l4, §5sRUAR A 











下 面 引 入 一 个 算法 来 解决 1 螺旋 多 边 形 最 小 合作 警卫 问题 。 


算法 3-7 解决 1 螺旋 多 边 形 最 小 合作 警卫 问题 的 算法 
输入 : 一 个 1 螺旋 多 边 形 P。 
输出 : 最 小 合作 和 警卫 问题 解 的 点 集 。 
步骤 1. 找到 P 的 反射 链 RC 和 瑟 链 CC。 
步骤 2. 找到 CC 与 分 别 从 vw 和 vw 出 发 消 着 RC 的 第 一 条 边 和 最 后 一 条 边 的 直线 的 交点 和 ri。 
步骤 3. 令 k= 1。 
While 4 不 在 结束 区 域 中 do 
wi HL RP RCN Ae ER AE CCHIT File Chha 是 关 寺 4 的 无 支撑 线段 。) 
keke, 
End While 
BRR. GAl, b, s hho 


现在 来 证 明 算法 3-7 的 正确 性 。 首 先 引 入 一 些 标号 和 术语 ， 多 边 形 P 从 点 a 到 4b 按 逆 时 针 方向 
边界 的 一 个 子 链 记 为 Cla，b]。 

假设 4 是 相互 配合 的 警卫 的 集合 ， 它 能 看 到 整个 简单 多 边 形 已 ， 并 且 4 的 可 视图 是 连通 的 ， 
那么 称 4 为 关于 P 的 最 小 合作 警卫 问题 的 一 个 可 行 解 。 注 意 到 4 不 必 是 最 小 的 。 

令 点 x 和 y 在 P 的 山 链 上 ， 且 驰 是 一 个 支撑 线段 ， 节 将 P 分 为 三 个 子 多边 形 0，Q. 和 0Q,，0 
是 以 Cby， 如 和 0 为 边界 的 子 多 边 形 ， 但 是 不 包括 x 或 y。 .和 .是 另外 两 个 分 别 包含 和 v. 的 子 
多 边 形 ， 各 图 40 所 示 。 

假设 4 是 一 个 关于 P 的 最 小 合作 警卫 问题 的 可 行 解 ， 
于 入 将 至少 有 A 的 名 区 卫 移 到 中， 否则 ，4 的 可 视图 
将 不 会 连通 ， 这 是 由 于 任何 在 0, 和 0, 中 的 两 名 警卫 都 不 
会 看 到 对 方 。 

SPA-D DÉ, ih, h, s WANE- 
(EAT PREM. SLÆBCH, L-J ali 为 边界 
WER, (LAL, HL <i<k, SAWKFPN 
最 小 合作 警卫 问题 的 任意 可 行 解 ， 那 么 至 少 存在 4 的 一 图 ?40 支撑 线 恨 ay AIM, OMO, 
名 警卫 放 在 每 个 上 中 ， 其 中 1<i<k。 此 外 ， 很 明显 L; 不 相交 。 令 N 是 4 的 大 小 ， 那 么 N>K。 这 
说 明 k 是 关于 P 的 最 小 合作 警卫 问题 的 任何 可 行 解 中 警卫 的 最 小 数目 。 

TERT, b, o HIRE (minimality) ZE, HEK, L, es LEERE 
(visibility), BP, WERPEN RMR, b, oe, P-ATA. TR, MARY 
一 组 警卫 能 够 看 到 反射 链 的 所 有 边 时 ， 他 们 才能 看 到 整个 1 螺旋 多 边 形 。 令 支撑 线段 Ma SR 
射 链 相 交 于 c;，1<i<k-1， 并且 co = v,，c4 = Ce。 显然 !: 可 以 看 到 Cl[ci, cil, 1<i<k-1, 因此， 
{41，，…， 认 能 看 到 整个 反射 链 C[v,，v,]， 能 看 到 整个 1 螺旋 多 边 形 。 此 外 ， 根 据 算法 3-7 本 
身 ，{11，b，…， 相 的 可 视图 是 连通 的 。 这 说 明 算法 3-7 的 输出 是 最 小 合作 警卫 间 题 的 一 个 可 行 
解 。 由 于 警卫 的 数目 是 最 少 的 ， 可 以 得 出 结论 算法 3-7 产 生 了 一 个 最 优 解 。 

对 于 算法 3-7 的 时 间 复 杂 度 分 析 ， 令 1 螺旋 多 边 形 P 的 顶点 数目 为 x。 第 1 步 和 第 2 步 可 以 通过 对 
P 的 边界 的 线性 扫描 在 O(n) 时 间 内 完成 ， 第 3 步 可 以 进行 对 反射 链 逆 时 针 和 对 凸 链 顺 时 针 的 线性 
要 描 来 找到 所 有 需要 的 左 支撑 线段 。 步 统 3 也 可 以 在 O(n) 时 间 内 完成 。 因 此 ， 算 法 3-7 是 线性 的 。 


3.8 实验 结果 
为 了 说 明 贪 心 法 策略 的 能 力 ， 我 们 在 IBM PC 机 上 用 C 语 言 实现 了 找到 最 小 生成 树 的 Prim 算 
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法 ， 也 实现 了 另外 一 个 直接 的 算法 ， 这 个 算法 可 以 产生 图 G = (VY，E) 的 所 有 可 能 的 (n 一 1) 条 边 的 
集合 。 如 果 这 些 边 形成 一 个 圈 ， 那 么 它们 将 被 忽略 ， 反 之 这 棵 生成 树 的 总 长 度 被 计算 出 来 。 

检查 了 所 有 生成 树 之 后 ， 最 小 生成 树 就 被 找到 。 这 个 直接 的 方法 同样 用 C 语 言 来 完成 。 每 
一 个 数据 集合 相应 于 一 个 随机 产生 的 图 G = (V，E)。 表 3-3 总 结 了 实验 结果 ， 显 然 最 小 生成 树 问 
题 不 能 够 通过 直接 方法 来 解决 ，Prim 算 法 是 非常 有 效 的 。 


表 3-3 检测 Prim 算 法 有 效 性 的 实验 结果 
执行 时 间 CR) (平均 20 倍 ) 











MM JE] 直接 方法 Prim Ivi lë] 直接 方法 Prim 
10 10 0.305 0.014 50 200 一 1.209 
10 20 11.464 0.016 50 250 一 1.264 
10 30 17.629 0.022 60 120 一 1.648 
15 30 9738.883 0.041 60 180 一 1.868 
20 40 -一 0.077 60 240 一 1.978 
20 60 — 0.101 60 300 一 2.033 
20 80 一 0.113 70 140 一 2.527 
20 100 一 0.118 70 210 — 2.857 
30 60 一 0.250 70 280 一 2.967 
30 90 -一 0.275 70 350 一 3.132 
30 120 -一 0.319 80 160 一 3.791 
30 150 一 0.352 80 240 -一 4.176 
40 80 一 0.541 80 320 一 4.341 
40 120 一 0.607 80 400 一 — 4,560 
40 160 一 0.646 90 180 一 5.275 
40 200 一 0.698 90 270 一 5.714 
50 100 — 1.030 90 360 -一 6.154 
50 150 一 1.099 90 450 一 6.264 
3.9 注释 与 参考 


关于 更 多 贪心 法 的 讨论 ， 可 以 参阅 文献 Horowitz and Sahni (1978) 及 Papadimitriou and 
Steiglitz (1982)。 文 献 Korte and Louasz (1984) 介 绍 了 贪心 法 的 结构 框架 。 

解决 最 小 生成 树 问题 的 Kruskal 算 法 和 Prim 算 法 能 分 别 在 文献 Kruskal (1956) 和 Prim (1957) 
中 找到 ，Dijkstra 算 法 最 早出 现 于 文献 Dijkstra (1959)。 

由 贪心 法 产生 出 最 优 归 并 树 最 早出 现 于 文献 Huffman (1952)， 文 献 Schwartz (1964) 给 出 了 
一 个 算法 来 生成 Huffman 编 码 集 ， 最 小 圈 基 问题 产生 于 文献 Horton (1987), 

贪心 法 解决 2 终端 一 对 多 线路 分 配 问题 由 文献 Atallah and Hambrusch (1986) 提 出 ， 线 性 算法 
解决 1 螺旋 多 边 形 的 最 小 合作 警卫 问题 由 文献 Liaw and Lee (1994) 提 出 。 


3.10 进一步 的 阅读 资料 


尽管 贪心 法 的 概念 很 旱 以 前 就 提出 了 ， 但 是 现在 依然 在 出 版 很 多 有 趣 的 文章 讨论 它 。 对 于 
深入 研究 贪心 法 感 兴趣 的 人 来 说 ， 推 荐 以 下 的 文章 : Bein and Brucker (1986); Bein, Brucker 
and Tamir (1985); Blot, Fernandez de la Vega, Paschos and Saad (1995); Coffman, Langston 
and Langston (1984); Cunningham (1985); El-Zahar and Rival (1985); Faigle (1985), 
Fernandez-Baca and Williams (1991); Frieze, McDiarmid and Reed (1990); Hoffman (1988) 
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Rival and Zaguia (1987), 

当然 信心 法 也 可 以 用 作 近 似 算法 ( 见 本 书 第 9 章 )。 下 面 的 文章 是 很 好 的 参考 资料 : 
Gonzalez and Lee (1987); Levcopoulos and Lingas (1987) 及 Tarhio and Ukkonen (1988), 

对 于 一 些 新 近 出 版 的 文章 感 兴趣 ， 可 以 参阅 以 下 文献 : Akutsu, Miyano and Kuhara 
(2003); Ando, Fujishige and Naitoh (1995); Bekesi, Galambos, Pferschy and Woeginger 
(1997); Bhagavathi, Grosch and Olariu (1994); Cidon, Kutten, Mansour and Peleg (1995); 
Coffman, Langston and Langston (1984); Cowureur and Bresler (2000), Csur and Kao (2001); 
Erlebach and Jansen (1999); Gorodkin, Lyngso and Stormo (2001); Gudmundsson, 
Levcopoulos and Narasimhan (2002); Hashimoto and Barrera (2003); I[wamura(1993), Jorma and 
Ukkonen (1988); Krogh, Brown, Mian, Sjolander and Haussler (1994); Maggs and Sitaraman 
(1999), Petr (1996); Slavik (1997), Tarhio and Ukkonen (1986); Tarhio and Ukkonen (1988); 
Tomasz (1998); Tsai, Tang and Chen (1994); Tsai, Tang and Chen (1996), and Zhang, 
Schwartz, Wagner and Miller (2003), 


习题 
3.1 使 用 Kruskal 算 法 找 出 下 图 的 最 小 生成 树 。 








3.2 使 用 Prim 算 法 找 出 题 3.1 中 图 的 最 小 生成 树 。 

3.3 证 明 Dijkstra 算 法 的 正确 性 。 

3.4 (a) 说 明 当 图 包含 负 权 的 边 时 ，Dijkstra 算 法 为 什么 将 失效 。 
(b) 修改 Dijkstra 算 法 ， 使 得 它 能 计算 在 有 负 权 边 但 是 没有 负 权 环 的 任意 一 幅 图 中 ， 从 源 结 点 到 

每 个 结 点 的 最 短路 径 。 

3.5 对 于 下 列 8 个 消息 CUM，M2，…，Ms) 得 到 一 个 最 优 的 赫 夫 曼 编 码 集 ， 这 8 个 消息 的 访问 频率 (9， 
qz，…，48) = (5，10，2，6，3，7，12，14)， 画 出 这 个 编码 集 的 解码 树 。 

3.6 找到 下 图 的 一 个 最 小 圈 基 。 











3.7 用 Dijkstra 算 法 找到 从 ”到 所 有 其 他 结 点 的 最 短路 径 。 
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3.8 


3.9 


3.10 
3.11 


3.13 








给 出 一 个 具有 启发 性 的 贪心 法 解决 0/1 背 包 问 题 ， 然 后 给 出 一 个 例子 证 明 贪心 法 不 是 总 能 产生 
最 优 解 。 

完成 Prim 算 法 和 Kruskal 算 法 ， 做 实验 比较 两 种 算法 的 性 能 。 

阅读 文献 Papadimitriou and Steiglitz(1982) 的 12.4 节 ， 了 解 矩阵 胚 与 贪心 法 间 的 关系 。 

背包 问题 定义 如 下 : 


已 知 正 整 数 P，， Py, hy P., W, W,, hy W, FIM, TRE È WX, SMRT, Xi, X2, mes 
X,, O<X,<1, (8H DPX 最 大 化 。 


给 出 一 个 贪心 法 找到 背包 问题 的 一 个 最 优 方案 ， 并 且 证 明 它 的 正确 性 。 

考虑 在 一 台 机 器 上 调度 "个 作业 的 问题 。 设 计 一 种 算法 找到 一 种 调度 方案 使 得 它 的 平均 完成 时 
间 是 最 小 的 ， 并 证 明 算法 的 正确 性 。 

Sollin 算 法 最 早 在 文献 Boruvka(1926) 中 提出 ， 是 为 了 在 连通 图 G 上 找到 一 棵 最 小 生成 树 。 初 始 
时 ，G 中 的 每 个 顶点 被 视 为 一 个 单 结 点 的 树 ， 不 选择 任何 边 。 在 每 一 步 ， 为 每 棵 树 选择 一 条 最 
小 权 的 边 e， 使 得 e 只 有 一 个 顶点 在 7 中 。 如 果 必 要 的 话 ， 除 去 所 选 边 的 备份 。 当 只 得 到 一 棵 树 
或 者 所 有 的 边 都 被 选中 了 ， 那 么 终止 算法 。 证 明 算 法 的 正确 性 并 且 求 出 算法 的 最 大 步 数 。 








第 4 章 分 治 策略 


分 治 策略 (divide-and-conquer strategy) 是 一 种 设计 高 效 算法 有 力 的 范 型 。 该 方法 首先 将 
问题 划分 为 两 个 较 小 的 子 问 题 , 每 个 子 问题 除了 输入 规模 较 小 以 外 ,其 他 都 与 原 问 题 是 一 样 的 。 
然后 ， 分 别 解 决 这 两 个 子 问题 ， 最 后 将 子 问题 的 解 合并 成 为 原 问题 的 最 终 解 。 

关于 分 治 法 非常 重要 的 一 点 是 将 原 问题 划分 为 两 个 子 问 题 ， 且 子 问 题 与 原 问题 是 相同 的 。 
因此 ， 这 两 个 子 问题 能 够 再 次 使 用 分 治 法 解决 。 或 者 换言之 ， 这 两 个 子 问题 可 以 递归 求解 。 

考虑 一 个 简单 问题 : 找 出 具有 7 个 元 素 集合 8 中 的 最 大 元 素 。 分 治 法 通过 将 输入 分 成 两 个 集 
合 解 决 该 问题 ， 每 个 子 集 含有 n/2 个 元 素 ， 称 这 两 个 子 集 为 S$, 和 5,。 现 在 找 出 集合 5S, 和 5 各自 的 
最 大 元 素 ， 将 集合 5 的 最 大 元 素 表 示 为 X(i = 1，2)， 那 么 集合 5 的 最 大 元 素 可 通过 比较 X, 和 XX 来 
确定 ， 大 者 就 是 集合 5 的 最 大 元 素 。 

在 上 面 的 讨论 中 ， 不 经 意 地 提 及 要 找 出 最 大 的 Xi。 但 是 ， 如 何 找 呢 ? 可 以 再 次 使 用 分 治 策 
略 。 也 就 是 ， 划 分 集合 8 为 两 个 子 集合 ， 找 出 子 集合 的 大 者 ， 然 后 合并 结果 。 

一 般 地 ， 分 治 算法 由 三 步 组 成 。 

步骤 1 ， 如 果 问 题 规模 较 小 ， 那 么 使 用 某 种 方法 直接 解决 它 ， 否 则 ， 划 分 原 问 题 成 两 个 子 
问题 ， 最 好 以 相同 的 规模 划分 。 

步骤 2: 对 子 问 题 使 用 分 治 算法 递归 地 解决 这 两 个 子 问 题 。 

步骤 3: 合并 子 问 题 的 解 成 为 原 问题 的 解 。 

步骤 2 的 递归 产生 越 来 越 小 的 子 问 题 。 最 终 ， 这 些 子 问题 将 小 到 可 以 容易 地 直接 解决 。 

下 面 通过 解决 找 集合 中 最 大 元 素 的 例子 说 明 分 治 法 的 含义 。 假 如 有 八 个 数字 : 29, 14, 15, 
1，6，10，32 和 12。 分 治 策略 找 出 这 八 个 数字 中 的 最 大 者 ， 如 图 4-1 所 示 。 





如 图 4-1 所 示 ， 八 个 数字 首先 划分 成 两 个 32 

子 集合 ， 每 个 子 集合 进一步 划分 成 由 两 个 元 | 

素 组 成 的 子 集合 。 当 子 集合 仅 有 两 个 数字 时 ， [mms ew 12 | 
不 必 再 划分 。 这 两 个 数字 的 简单 比较 可 确定 





最 大 者 。 

在 找 出 四 个 最 大 者 之 后 ， 合 并 过 程 开 始 。 
这 样 ，29 与 15 比 较 ，10 与 32 比 较 。 最 终 ， 通 
过 32 与 29 的 比较 找 出 32 是 最 大 者 。 

一 般 ， 分 褒 算 法 的 复杂 度 T(n) 由 下 面 的 
公式 确定 : 








Tin)= { /2)+S(n)+M(n) n>c 
b n<c 图 4-1 找 出 八 个 数字 中 最 大 者 的 分 治 策略 
其 中 5S(n) 表 示 划 分 问题 成 为 两 个 子 问题 所 需 的 时 间 步 数 ，M(n) 表 示 合 并 两 个 子 问题 所 需 的 时 间 
步 数 ，b 是 一 个 常数 。 找 出 最 大 者 的 问题 ， 划 分 和 合并 都 花费 常数 级 步 数 。 因 此 ， 可 以 得 到 
2T(n/2)+1 n>2 
re- n=2 


假设 = 2， 可 以 得 到 





0 #4 # 





T(n) = 2T(n/2) + 1 
=2(2T(n/4)+ 1) +1 


k-2 
= 2° 'T(2)+ 2 
j= 


=25' 4+2 一 | 
= 2 一 ! 
= 1 一 | 
读者 可 能 注意 到 应 用 分 治 策略 找 出 最 大 元 素 只 是 为 了 说 明 其 含义 。 显 然 在 此 例 中 ， 分 治 策 
略 并 不 非常 有 效 ， 因 为 直接 地 扫描 这 n 个 数字 并 做 n 一 1 次 比较 找 出 最 大 者 与 分 治 策略 具有 同样 
的 效率 。 但 是 ， 在 后 面 各 节 中 将 说 明 在 许多 情况 下 ， 特 别 是 在 几何 问题 上 ， 分 治 策略 确实 是 非 
常 好 的 方法 。 


4.1 求 2 维 极 大 点 问题 


在 2 维 空间 中 ， 如 果 x>x, 且 y,>y,， 那 么 称 点 (x1，y1) 支 配点 (xz:，);)。 如 果 一 个 点 没有 其 他 
点 支配 ， 那 么 称 其 为 极 大 者 (maxima), Cen tp RRA, KARA (maxima finding 
problem) 是 指 找 出 在 n 个 点 中 的 所 有 极点 。 例 如， 图 4-2 中 的 圆圈 点 就 是 极 大 点 。 








图 4-2 极 大 点 


解决 求 极 大 点 问题 的 直接 方法 是 比较 每 一 对 点 ， 该 方法 需要 Ol) 次 点 的 比较 。 正 如 下 面 将 
要 证 明 的 ， 如 果 使 用 分 治 策 略 ， 那 么 可 以 在 O(n log n) 步 数 内 解决 该 问题 ， 这 的 确 是 很 好 的 改进 。 

如 果 使 用 分 治 策略 ， 那 么 首先 找 出 垂直 于 x 轴 的 中 位 线 L， 它 划分 整个 点 集 为 两 个 子 集 ， 如 
图 4-3 所 示 。 分 别 用 SL. 和 $x 表示 中 线 L 的 左边 点 集合 和 右边 点 集合 。 
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图 4-3 5, 和 5% 的 极 大 点 
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下 一 步 ， 分 别 找 出 5, 和 Si 的 极 大 点 。 如 图 4-3 所 示 ，P,、Ps 和 P; 是 5, 中 的 极 大 点 ， 而 Pe、P。 
和 Pio 是 Sx 中 的 极 大 点 。 

合并 过 程 相当 简单 。 由 于 在 $x 中 点 的 x 值 总 是 大 于 5 中 每 个 点 的 x 值 ， 所 以 5 中 的 点 是 极 大 
点 当 且 仅 当 它 的 y 值 不 小 于 5s 中 极 大 点 的 y 值 。 例 如 图 4-3 所 示 的 情形 ， 因 为 P; 被 Se 中 的 Ps 所 支配 ， 
所 以 它 被 丢弃 。 因 此 ，5 中 的 极 大 点 集合 是 P!,、P,、Ps、Ps 和 Plo。 

基于 上 面 的 讨论 ， 现 在 对 解决 求 2 维 极 大 点 问题 的 分 治 算法 总 结 如 下 : 


算法 4-1 在 平面 中 找 出 极 大 点 的 分 治 方法 

输入 : "个 平面 点 的 集合 。 

输出 :5 的 极 大 点 。 

步骤 1. 如 果 5 只 含 一 个 点 ， 那 么 输出 该 点 为 极 大 点 ， 省 则 ， 找 一 条 垂直 于 x 轴 的 直线 L， 它 划分 点 集合 为 随 个 子 
集合 5S. 和 5k， 每 个 子 集 含有 n/2 个 点 。 

步骤 2. 递归 地 找 册 5, 和 54 的 极 大 点 。 

步骤 3. 将 8 和 Sn 的 极 大 点 投影 到 直线 上 上， 并 根据 它们 的 > 值 排序 这 些 点 。 对 投影 进行 线性 扫描 ， 如 果 Sc 中 的 极 
大 点 的 > 值 小 于 Se 中 某 个 极 大 点 的 y 值 ， 那 么 舍弃 它 。 


该 算法 的 时 间 复 杂 度 依赖 于 下 面 步骤 的 时 间 复 杂 度 ; 
(D 在 步骤 1 中 ， 有 一 个 找 出 "个 数 的 中 位 数 操作 ， 后 面 将 证 明 该 操作 需要 在 OUoD) 步 数 内 完成 。 
(2) 在 步骤 2 中 ， 有 两 个 子 问题 ， 均 有 /2 个 点 。 
(3) 在 步骤 3 中 ， 依 据 y 值 对 n 个 点 排序 后 ， 投 影 和 线性 扫描 需要 在 O(n log nn) 步 数 内 完成 。 
令 T(n) 表 示 在 平面 内 对 找 出 x 个 点 中 极 大 点 的 分 治 算法 时 间 复 杂 度 ， 那 么 
T(n)= 人” /2)+O(n)+ O(nlogn) 7>1 
1 n=1 
令 n =2， 易 证 得 
T(n) = O(n log n) + O(n logn) = O(n log’n) 
因此 ， 得 到 一 个 O(n logn) 时 间 的 算法 。 读 者 记得 ， 如 果 穷 尽 地 检验 每 对 点 的 直接 方法 ， 
需要 O(n ) 步 。 
注意 解决 该 问题 的 分 治 策略 是 由 合并 阶段 的 排序 决定 的 。 因 为 排序 是 一 劳 永 逸 的 ， 所 以 我 
们 并 未 做 太 有 效 的 工作 。 也 就 是 ， 应 该 先 执行 排序 。 如 果 这 么 做 ， 那 么 合并 的 复杂 度 是 O(n)， 
所 需 的 总 时 间 步 数 是 
O(n log n) + T(n) 


其 中 


1 n=1 


T(n) 很 容易 确定 是 O(n log n)。 因 此 ， 具 有 预 排序 的 分 治 策略 找 出 极 大 点 总 的 时 间 复 杂 度 是 
O(n log n)。 换 句 话 说 ,我们 得 到 了 一 个 更 有 效 的 算法 。 


4.2 最 近 点 对 问题 


最 近 点 对 问题 (closest pair problem) 定义 如 下 : 已 知 n 个 点 的 集合 ， 找 出 最 接近 的 一 对 点 。 
1 维 最 近 点 对 问题 可 在 O(n log nn) 步 数 内 解决 ， 这 通过 对 nn 个 点 排序 ， 并 执行 线性 扫描 ， 对 排 好 
序 的 队列 考查 每 对 相 邻 点 间 的 距离 ， 可 以 确定 最 近 点 对 。 

在 2 维 空间 里 ， 可 用 分 治 策略 设计 有 效 算法 来 找 出 最 近 点 对 。 如 同 解决 求 极 大 点 问题 ， 首 


T(n) = 人 /2)+O(n)+O(n) n>l1 
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先 划 分 集合 5 为 5, 和 5%， 使 得 5, 中 的 每 个 点 位 于 Sx 中 的 每 个 点 的 左边 ， 并 且 5, 中 的 点 与 54 中 的 点 
数 相同 。 也 就 是 ， 找 一 条 垂直 于 x 轴 的 纵向 线 L， 使 集合 5 划分 成 两 个 相同 规模 大 小 的 子 集合 。 
分 别 在 S$, 和 54 中 解决 最 近 点 对 问题 ， 得 到 di 和 dn， 分 别 表示 在 $5, 和 5x 中 最 近 点 对 的 距离 。 令 d = 
min(d,，dr)。 如 果 5 中 的 最 近 点 对 (P。，Pp) 是 一 个 点 在 5, 中 ， 另 一 个 点 在 S54 中， 那么 P, 和 P, 一 定 
是 在 以 直线 [为 中 心 的 一 个 片 隙 (slab) 内 ， 它 是 以 线 L-d 和 L + d 为 界 ， 如 图 4-4 所 示 。 








L-d Lt+d d = min(d,, dp) 
图 4-4 最 近 点 对 


上 述 的 讨论 表明 在 合并 步 又 内 ， 只 考查 在 片 陈 内 的 点 。 尽 管 平均 看 来 ， 在 片 隙 内 点 的 数量 
不 可 能 太 多 ， 在 最 坏 情 况 下 片 隙 内 有 n 个 点 。 这 样 ， 在 片 陵 内 找 出 最 近 点 对 的 蛮 力 方法 需要 计 
算 n2/4 个 距离 和 比较 。 这 种 合并 步 难 对 分 治 算法 并 不 有 利 。 幸 运 的 是 ， 正 如 下 面 要 证 明 的 ， 合 
并 步 又 能 在 O(n) 时 间 内 完成 。 

如 果 在 5, 中 的 点 P 与 在 Sx 中 的 点 @ 成 为 最 近 点 对 ， 那 么 点 P 和 8 间 的 距离 必定 小 于 d4。 因 此 ， 
不 必 考 虑 远离 点 P 的 点 。 如 图 4-5 所 示 ， 只 需 检 验 图 4-5 中 的 阴影 区 域 。 如 果 点 P 正 好 在 直线 L 上 ， 
那么 阴影 区 域 最 大 。 即 使 这 样 ， 阴 影 区 域 也 只 包含 在 d x 24 的 长 方形 4 中 ， 如 图 4-6 所 示 。 这 样 ， 
只 需 考查 在 长 方形 4 中 的 点 。 











A 
d N 
P 2d 
| A 
d 
4 
图 4-5 考查 分 治 最 近 点 对 算法 的 合并 
图 4-6 长 方形 4 含有 可 能 的 点 P 的 最 近邻 点 

二 程 的 有 限 区 域 图 4-6 长 方形 4 含有 可 能 最 


接 下 来 的 问题 是 : 在 长 方形 4 中 有 多 少 点 ?由 于 已 知 在 5, 和 5x 中 的 每 对 点 间 的 距离 都 大 于 
或 等 于 d， 邦 么 至 多 有 6 个 点 在 该 长 方形 中 ， 如 图 4-6 所 示 。 基 于 此 观察 ， 我 们 知道 对 于 片 隙 中 
每 个 点 P， 在 合并 步 又 中 ， 只 需 检验 片 阶 另 一 半 有 限 数量 的 点 。 不 失 一 般 性 ， 假 定点 P 在 片 隙 
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的 左 半 部 分 ， 将 点 P 的 y 值 表示 为 w。 对 于 点 P， 只 需要 检验 片 陈 另 一 部 分 的 点 ， 这 些 点 的 y 值 在 
+ d 和 y,-d 内 。 正 如 前 面 的 讨论 ， 最 多 有 6 个 这 样 的 点 。 

如 前 所 述 ， 在 使 用 分 治 算法 前 ， 需 要 对 "个 点 依据 其 y 值 排序 。 在 预 排序 后 ， 合 并 步 又 将 花 
费 O(n) 步 数 。 

下 面 是 解决 2 维 最 近 点 对 问题 的 分 治 算法 。 


算法 4-2 解决 2 维 最 近 点 对 问题 的 分 治 算法 

MA: 平面 Fa 个 点 的 焦 合 S。 

输出 : A UE ATH] UB A 

步骤 1. AGE A Ae fi ASB IEE 

步骤 2. MRSS - Pai, UWA. ot HR 

步骤 3. HH EM RL. TERS sy BRT A DAY TESS TES, AO RF RL AY, T 
集 Sk 中 的 点 位 于 直 线 上 的 右边 。 

步骤 4. 将 步 野 2 和 步 又 3 递归 地 应 用 于 解决 了 集 S 和 Sn 的 最 近 点 对 问题 。 令 必 (da) 表 示 存 3:(Sw) 中 最 近 点 对 间 的 距 
B, Ji ed=min(d,, de). 

步骤 5. 将 以 [一 4 和 L + GAR. RAMA RS AEL EP Lda L RANA, Ey 
(Ad A Ay, WF ETA, FEMA HE ELA + ORAS, CURVER Ey, + dily, ~d 
内 。 如 果 点 P 与 在 男 一 于 片 限 内 的 点 的 距离 4 小 十 4， 令 d = d'。 最 后 的 y 值 就 是 答案 。 


整个 算法 的 时 间 复 杂 度 等 于 O(n logn) + T(n), 并 且 
T(n) = 2T(n/2) + S(n) + M(n) 
S(n)FUM(n) 53 Bll ae BR 3 HB ly DR AR FE RY a] SS BE. RE OC) HB, 
A LER. ASP SC RH EL-d SL + d 间 的 点 ， 因 为 已 按 x 值 排序 ， 这 在 
O() 步 数 内 完成 。 对 于 每 个 点 ， 至 多 需要 检验 另外 12 个 点 ， 每 半 个 片 隙 6 个 点 。 这 样 ， 线 性 扫 
描 花 费 O(n) 步 数 。 换 句 话说 ， 合 并 步 又 是 O(n) 时 间 复 杂 度 。 


这 样 ， 
Tin) = | {2)+0(n)+0(n) n>} 
1 n=1 
很 容易 证 明 


T(n) = O(n log n) 
总 的 时 间 复 杂 度 是 O(n log n)〔( 预 排序 的 时 间 复 杂 度 ) + O(n log n) = O(n log n). 
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山 包 问题 已 在 第 2 章 提 到 。 在 本 节 将 说 明山 包 问 题 可 用 分 治 策略 漂亮 地 解决 。 
凸 多 边 形 (convex polygon) 具有 在 多 边 形 内 连接 任意 两 点 的 线段 一 定 还 在 该 多 边 形 内 的 
性 质 。 图 4-7a 显 示 一 个 非 凸 多 边 形 ， 图 4-7b 显 示 了 一 个 凸 多 边 形 。 


a) b) 
图 4-7 MELEM AÉ 
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平面 点 集 的 是 包 定 义 为 包含 所 有 点 的 最 小 西 多 边 形 。 例 如 ， 图 4-8 显 示 了 一 个 典型 的 凸 包 。 
为 了 找 出 西 包 ， 可 以 使 用 分 治 策略 。 参 见 图 4-9， 
平面 点 集 已 被 垂直 于 x 轴 的 直线 分 成 两 个 子 集 % AMS, 
FRS 和 8 的 凸 包 已 构成 ， 分 别 表 示 为 Hul(S,) 和 
Huls. H T APH 和 Hull(Sa) 成 为 一 个 凸 包 ， 
可 以 使 用 Graham 扫 搞 (Graham's scan), 
为 了 进行 Graham 扫 描 ， 选 择 一 个 内 部 点 。 将 该 
点 作为 起 始点 ， 这 样 其 他 每 个 点 相对 于 该 点 都 形成 
极 角 (polar angle)。 将 所 有 的 点 按照 极 角 排序 ， 
Graham 扫描 方法 逐个 检查 这 些 点 ， 删 去 产生 折 回 角 图 4-8 一 个 西 包 
(reflexive angle) 的 点 ， 如 图 4-10 所 示 ,h，f,e 和 和 li 
将 被 删 去 ， 剩 余 的 点 为 凸 包 顶 点 。 





图 4-10 Graham 扫描 


在 子 集 Hull(5,) 和 Hull(51) 构 造 后 ， 为 了 进行 Graham 扫 描 ， 可 以 选择 Huoll(5,) 的 内 部 点 P。 显 
然 ， 在 该 山 包 内 的 点 都 不 必 检 查 。 因 为 从 点 P 处 看 ，Hull(5%) 位 于 一 个 模 内 ， 它 的 顶 角 (apex 
angle) 等 于 或 小 于 x。 该 攀 由 Hull(Se) 中 两 个 顶点 zx 和 定义 ， 可 在 线性 时 间 内 由 下 面 的 过 程 找 出 : 
构造 一 个 通过 点 P 的 水 平 线 ， 如 果 该 线 与 HullSa 相 交 ， 那 么 HullkSa 在 由 Hull(Sa 中 的 两 顶点 所 
确定 的 模 内 ， 两 顶点 中 最 大 的 极 角 小 于 zwW/2， 最 小 的 极 角 大 于 3n/2。 如 果 通 过 点 P 的 水 平 线 不 与 
Huli(S) 相 交 ， 那 么 横 由 关于 P 的 最 大 和 最 小 极 角 对 着 的 点 所 确定 。 在 图 4-9 中 ， 它 们 是 a 和 4d。 
这 样 ， 相 对 于 5, 的 内 部 点 P 有 三 个 递增 极 角 的 点 序列 。 它 们 是 
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(lg, h, i, j, k 

(2)a, b,c, d 
和 (3)f,e。 

可 以 合并 这 三 个 点 序列 为 一 个 序列 。 在 
所 举 的 例子 中 ， 合 并 的 序列 是 

g, h,a, b, f,c, e, d, i, j, k 

Graham 扫描 可 以 应 用 于 此 序列 以 删 去 不 
在 凸 包 中 的 点 。 对 于 如 图 4-9 所 示 的 情况 ， 结 
果 的 凸 包 如 图 4-11 所 示 。 1 

构造 出 包 的 分 治 算法 如 下 。 图 4-11 图 4-9 中 点 的 凸 包 








算法 4-3 ”基于 分 治 策略 构造 凸 包 的 算法 
MA: 平面 上 的 点 集合 S。 
输出 : 集合 5 的 三 包 。 
步骤 1. 如 果 集 合 S 有 不 超过 5 个 点 ， 邦 么 使 用 穷尽 搜索 找 出 凸 包 并 返 叫 。 
步骤 2. 找 出 重 直 于 -< 币 的 中 线 上 ， 将 集合 8 划分 成 相同 大 小 的 子 集 8 和 Se， 且 3 位 于 Sn 的 左边 。 
步骤 3. 递归 地 对 S: 和 Sn 构造 凸 包 ， 分 别 以 Hull(S2) 和 Haull(Sa 表 示 各 白 的 凸 包 。 
步骤 4. 找 出 8 的 一 个 内 部 点 P， 确 定 Hull(Sa 的 两 个 点 上 和 >， 划分 Hull(Sa) 的 顶点 成 两 个 相对 于 点 P 渐 增 极 角 的 
顶点 序列 。 不 失 一 般 性 ， 假 定 w 的 ? 值 大 于 疡 ， 那 么 形成 如 下 三 个 序列 ， 
(a) 序列 1，Hull(so) 的 所 有 凸 包 顶点 都 沿 反 时 针 方 向 。 
(b) FEZ, Hull(Sa) 中 从 关 到 w 的 凸 包 顶 点 沿 反 时 针 方 向 。 
(c) 序列 3，HulK(5w) 中 从 vy 到 vv 的 凸 包 顶点 沿 顾 时 针 方向 。 
合并 这 三 种 序列 ， 并 进行 Graham 扫描 。 删 去 折 同 的 点 ， 剩 余 的 点 形成 四 包 。 


上 面 算 法 的 时 间 复 杂 度 基本 上 由 划分 过 程 和 合并 过 程 决 定 。 因 为 划分 过 程 是 一 个 中 值 查找 
过 程 ， 所 以 它 的 时 间 复 杂 度 是 O(n)。 因 为 对 于 内 部 点 的 检索 、 极 值 点 的 确定 、 合 并 以 及 
Graham 扫 描 都 花费 O(n) 步 ， 所 以 合并 过 程 的 时 间 复 杂 度 是 O(n)， 这 样 ，T(n) = 2T(n/2) + O(n) = 
O(n log n). 


4.4 用 分 治 策略 构造 Voronoi 图 


Voronoi 图 如 同 第 3 章 介绍 的 最 小 生成 树 ， 是 一 种 非常 有 趣 的 数据 结构 。 该 数据 结构 可 用 于 
存储 有 关 平 面 中 点 的 最 近邻 点 的 重要 信息 。 
先 考虑 图 4-12 中 所 示 的 两 个 点 的 情况 。 在 图 4-12 中 ， 直 线 L1s 是 连接 P1 和 Ps 的 垂直 平分 线 
(perpendicular bisector)，Li; 就 是 PI/ 和 Ps 的 Voronoi 图 。 位 于 Li; 左 Liz 
(H) 半 平 面 的 每 个 点 X 在 已 与 P: 间 ，X 的 最 近邻 点 就 是 PCP2)。 
在 此 意义 上 ， 已 知 任意 点 X， 为 找 出 X 的 最 近邻 点 ， 不 必 计 算 X 与 
P, 和 P; 间 的 距离 ， 只 需 确定 位 于 ;的 哪 一 边 。 这 可 通过 将 X 的 从 p p 
标 代 入 Li 来 做 。 依 赖 于 此 代 换 结果 的 符号 ， 可 确定 X 位 于 何 处 。 a ? 
图 4-13 中 每 条 世 是 连接 Pi 与 P 间 直线 的 垂直 平分 线 。 三 个 超 
FHL», L FUL AR AP PB 和 P; 的 Voronoi 图 。 如 果 某 点 位 于 
某 个 R 中 ， 那 么 该 点 在 P!/、Ps 和 P; 中 的 最 近邻 点 就 是 Pi。 | 
为 定义 平面 点 集 的 Voronoi 图 ， 首 先 定义 Voronoi 多 边 形 。 图 4-12 两 个 点 的 Voronoi 图 
定义 ”已 知 在 n 个 点 集合 S 中 的 两 个 点 P; 和 P)， 令 H(P;，P) 表 示 包 含 较 接近 Pi 的 点 集合 
的 半 平 面 ， 相 对 于 Pj; 的 Voronoi 多 边 形 是 不 超过 n 一 1 条 边 的 凸 多 边 形 区 域 ， 用 V(i) = 
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(VHP. PA, 
-个 Voronoi 多 边 形 如 图 4-14 所 示 。 已 知 n 个 点 的 集合 ，Voronoi 图 包含 这 些 点 的 所 有 Yoronoi 
多 边 形 。 etme 称 为 Voronoi 点 ， 它 的 线段 称 为 Voronoi 边 。 (名 字 Voronoi 起 源 于 一 位 
等 名 的 俄罗斯 数学 家 。) 一 个 具有 6 个 点 的 Voronoi 图 表示 在 图 4-15 中 。 





RO Ps ° 
图 4-13 三 个 点 的 Yoronoi 图 图 4-14 Voronoi 多 边 形 
VYoronoi 图 的 直线 对 偶 称 为 Delaunay 三 角 训 分 (Delaunay triangulation)， 为 纪念 著名 的 法 国 
数学 家 。 在 Delaunay 三 角 剖 分 中 有 连接 已 和 P 的 线段 ， 当 上 且 仅 当 Pi 和 Pj 的 Voronoi 多 边 形 有 共同 
边 。 例 如 ， 图 4-15， 它 的 Delaunay 三 角 训 分 如 图 4-16 所 示 。 


Voronoi 图 有 很 多 应 用 。 例 如 ， 可 以 从 Yorono 图 中 提取 信息 来 解决 称 为 所 有 最 近 点 对 的 问 
题 ， 最 小 生成 树 世 可 从 Voronoi 图 中 求解 。 
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图 4-15 6 个 点 的 Vorono 图 图 4-16 Delaunay 三 角 剖 分 
Voronoi 图 可 以 用 算法 4-4 的 分 治 方法 形式 构造 。 


算法 4-4 ”构造 Voronoi 图 的 分 治 策略 算法 
输入 : 1 个 平面 点 集合 5 
输出 : 集合 5 的 Voronoi 图 。 
步骤 1. 如 果 集 合 S 只 有 1 个 点 ， 那 么 返回 。 
步骤 2. 找 出 重 直 于 x 轴 的 中 线 L， 将 8 划分 成 相同 大 小 的 S\ 和 Se， 使 得 S,(3S 位 二 的 左 〈 右 ) 边 。 
步骤 3. 递 申 地 构造 % ASAI Voronoi, 4y BILAVD(S,) #IVD(S,) 47% & BAI Voronoi R. 
PRA HERALD EAP, CEES, PPS, Nie PPA WIV, BAS 
RRA EHP fe idl VD(S,) ZR R TAIE AZ SAY Voronoi R, 
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通过 考虑 图 4-17 来 理解 该 算法 。 为 了 合并 VD(S) 和 VYD(S ， 观 察 到 ， 只 有 VD(SJ) 和 VD(SA) 
接近 [的 部 分 会 互相 干扰 。 而 远离 L 的 点 不 受 合并 步骤 的 影响 ， 并 保持 原样 。 

合并 VD(5,) 和 VD(Sw) 最 重要 的 步 又 是 构建 分 段 直线 超 平面 HP。 此 超 平面 有 下 述 性 质 ， 如 果 
点 P 在 HP 的 左 ( 右 ) 边 内 ， 那 么 点 P 的 最 近邻 点 一 定 是 $5,(5g) 中 的 点 。 图 4-17 中 VD(5,) 和 VD(Sn) 
的 HP 显示 在 图 4-18 中 。 
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VD(SA) 


图 4-17 步骤 2 后 的 两 个 Voronoi 图 


VD(S1) VD(SR) 





图 4-18 图 4-17 中 点 集 的 分 段 直 线 超 平面 


在 删除 所 有 VD(S,) 到 HP 右边 与 所 有 VD(Sn) 到 HP 左边 的 直线 部 分 后 ， 得 到 结果 Voronoi 图 ， 
如 图 4-19 所 示 。 

剩 下 的 问题 是 如 何 有 效 地 找 出 HP。 构 造 HP 的 第 一 步 是 找 出 $, 和 S54 的 两 个 顶部 元 素 ， 它 们 是 
P. 和 Ps,。 现 在 构造 直线 EE 的 垂直 平分 线 ， 这 是 HP 的 开始 线段 。 如 图 4-18 所 示 ，HP 与 BB 的 平 
分 线 相交 于 a 点 。 这 样 ， 知 道 轨迹 将 比 P 更 接近 Ps。 换 旬 话 说， 下 一 线段 将 是 BE 的 平分 线 。 

继续 向 下 移 ，HP 将 与 VD(S,) 相 交 于 点 a/。VD(S0) 与 HP 相交 的 线段 是 PP, FESR. AHE, 
新 的 线段 将 是 PR 的 平分 线 。 

通过 另 一 个 例子 来 说 明 构 造 Voronoi 图 的 过 程 ， 考 虑 图 4-20 中 的 6 个 点 。 
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图 4-19 图 4-17 中 点 集 的 Voronoi 图 


图 4-20 显 示 了 分 别 对 {P,，P,，P;} 和 {Ps,，Ps;，P6} 构 造 的 两 个 Voronoi 图 ， 都 用 射线 标记 。 
(AU, by AeA 玉 必 的 垂直 平分 线 。 构 造 Voronoi 图 的 过 程 需要 构造 止 包 。 两 个 凸 包 显 示 在 图 4-20 
中 ， 它 们 都 是 三 角形 。 在 构造 两 个 凸 包 后 ， 推 断 线段 PB 和 RF 是 应 添加 到 两 个 凸 包 的 两 条 线 
段 。 这 样 ， 合 并 步 又 从 找 出 PE 的 垂直 平分 线 开 始 ， 如 图 4-21 所 示 。 





图 4-20 说 明 构 造 Voronoi 图 的 另 一 种 情形 


整个 合并 过 程 由 下 面 步 又 构成 : 

O) PR 的 垂直 平分 线 与 线 bss 相 交 于 b 点 。 现 在 找 出 PP, 的 垂直 平分 线 ， 用 bs 表示 。 

(2) p14 与 513 相 交 于 c 点 ， 下 一 条 BP 的 垂直 平分 线 将 是 b3。 

(3) bw 与 bw% 相 交 于 d 点 ， 下 一 条 已 尺 的 垂直 平分 线 将 是 be。 

(4) px 与 ps 相交 于 e 点 ， 下 一 条 PP EEFDE bo 

由 于 P 和 P, 是 两 个 凸 包 中 最 低 的 点 ， 射 线 bze 无 限 延伸 ， 就 找 出 分 段 直线 超 平面 HP。 这 样 ， 
HPH ab. be. cd, de Alef 所 确定 。 如 果 某 点 落 入 HP 的 右 ( 左 ) 边 ， 它 的 最 近邻 点 一 定 在 
{P,, Ps, Po} GPi Pa, Psd) 中 。 

图 4-21 显 示 了 所 有 构成 分 段 超 平面 的 这 些 垂直 平分 线 ， 用 虚线 标记 。 这 些 线段 是 BP 、 
PB. PP, PR 和 RP. 

在 合并 步骤 中 ， 最 后 一 步 是 删除 所 有 向 HP 右 ( 左 ) 延伸 的 VD(5.) (VDS). RAM 
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Voronoi 图 如 图 4-22 所 示 。 





图 4-21 构造 Yoronoi 图 的 合并 步骤 图 4-22 最 终 的 Yoronoi 图 
现在 介绍 合并 两 个 Yoronoi 图 的 算法 。 


算法 4-5 将 两 个 Voronoi 图 合并 成 一 个 Voronoi 图 的 算法 

输入 : (a) S 和 Sa， Si, 和 Sn 是 被 垂 线 L 所 划分 。 
(b) VD(S) 和 VD(SA。 

输出 : VD(S), 其 中 5 = Si:USk。 

步骤 1. 找 出 S$, 和 5 的 上 是 包 ， 将 它们 分 别 表 示 为 Hull(S,) 和 Hull(Sx)。 (在 此 情况 下 找 出 凸 包 的 特定 算法 会 在 稍 后 给 
出 。) 

步骤 2. 找 出 将 Hull(S) 和 Hull(Sj) 合 并 成 一 个 凸 包 的 线段 PP, APP, (Ps 和 Ps 属于 S.，P. 和 Ps 属于 Sr。) 假如 P,P, 
(iF PP WL, Sx=a, y=b, SG= PP, 以 及 HP= 9. 

步骤 3. 找 出 SG 的 垂直 平分 线 ， 并 用 BS 表 示 。 令 HP = HPUBS。 如 果 SG = 尺 P ， 那 么 转向 步骤 5， 否 则 ， 转 癌 步 
m4, 

步骤 4. 令 8S 首 先 与 来 自 VYD(S)) 或 VD(Sn) 的 射线 相交 。 该 射线 一 定 是 相对 于 某 z 的 PRM PP EEFDE. w 
果 该 射线 是 PPWEAPDR, BASSG= PP, BU 令 SG = PP, 
并 转向 步骤 3。 

步骤 5. 删除 VD(S) 中 向 HP 右 延 伸 的 边 ， 删 除 VD(Sa 中 向 PP 左 延 伸 的 边 。 最 终 的 图 就 是 3 = S, U Sg 的 Voronoi 图 。 

eee sss S a MŘŘħŘħ—— 


接 下 来 详细 描述 HP 的 性 质 。 在 此 之 前 ， 先 定义 一 个 点 与 一 个 点 集 间 的 距离 。 

定义 已 知 点 P 和 点 Pl1，P,，…，P, 的 集合 5， 令 Pi 是 P 的 最 近邻 点 ， 那 么 P 与 5 间 的 距离 

就 是 P 与 P 间 的 距离 。 

根据 该 定义 可 以 声明 ， 从 算法 4-5 中 得 到 的 HP 是 保持 到 5 与 5 距离 相等 的 点 的 轨迹 。 也 就 
是 ， 对 于 HP 上 的 每 个 点 ， 令 Pj 和 P 分 别 是 P 与 $, 和 Sx 的 最 近邻 点 ， 那 么 P 与 P, 间 的 距离 等 于 P 与 P) 
间 的 距离 。 

例如 ， 参 见 图 4-21。 设 P 是 线段 到 上 的 点 。 对 于 % ，P 的 最 近邻 点 是 P;， 对 于 Se，P 的 最 近 
邻 点 是 P,。 由 于 cd 是 BP 的 垂直 平分 线 ， 所 以 ， 在 cd 上 的 每 点 到 P; 和 Ps 是 等 距离 的 。 这 
F, cd 上 的 每 一 点 到 5, 和 54 的 距离 是 相等 的 。 

利用 上 面 HP 的 性 质 ， 很 容易 理解 每 条 水 平 线 电 前 与 HP 至 少 相交 一 痰 ， 这 可 参见 图 4-23 来 
理解 。 
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想象 沿 直线 刀 从 左 向 右 和 移动。 起初， 某 个 点 已 的 最 近邻 点 一 定 是 8 中 的 点 。 假 如 从 右 向 左 
移动 ， 某 个 点 P, 的 最 近邻 点 一 定 是 Se 中 的 点 。 由 于 HH 是 连续 线 ， 一 定 有 -一 点 P 使 得 到 P 的 左 ( 右 )， 
每 点 都 有 在 5S,(5Si) 中 的 最 近邻 点 。 这 样 ，P 到 5 与 54 等 距 。 或 者 ，P 与 在 $1 中 的 最 近邻 点 间 的 距离 
一 定 等 于 P 与 在 Sk 中 的 最 近邻 点 间 的 距离 。 因 为 HP 是 到 5, 和 5 等 距 的 点 轨迹 ， 该 P 也 必定 在 HP 
上 。 这 样 ， 每 条 水 平 线 必定 与 HP 至 少 相 交 - -次 。 读 人 莉 可 研究 图 4-21 以 确信 和 前面 解 释 的 正确 性 。 

参见 图 4-21， 可 以 理解 HP 还 有 另 一 个 有 元 的 性 质 ， 它 对 于 > 是 单调 的 。 接 下 来 ， 证 明 每 条 
水 平 线 日 与 HP 至 多 相交 一 次 。 

假如 不 然 ， 那 么 有 一 点 P, 使 得 HP 转向 上 ， 如 图 4-24 所 示 。 

在 图 4-24 中 ，PP 是 吃 的 垂直 平分 线 ， PP 是 bc 的 牌 直 平 分 线 。 由 于 HP 是 划分 $1 和 S54 的 
轨迹 ， 那 么 或 者 a 和 c 属 于 5,，b 属 于 Ss， 或 者 a 和 c 属 于 Sx，b 属 于 S$,。 这 两 种 情况 都 是 不 可 能 的 ， 
因为 有 一 条 垂直 于 x 轴 的 线 将 8 划分 成 8 和 Sa。 也 就 是 已 不 可 能 存在 。 














S SR 
P, P P, 
H Z -十 - 
最 近邻 ES Feu Wes, 
图 4-23 水平线 H 与 5, 和 Sg 间 的 关系 图 4-24 HP 单调 性 的 举例 


由 于 每 条 水 平 线 太 与 HP 至 少 相交 一 次 ， 至 多 相交 一 次 。 所 以 推断 ， 每 条 水 平 线 电 与 HP 相交 
于 一 点 且 仅 一 点 。 也 就 是 HP 对 于 y 是 单调 的 。 

Voronoi 图 的 另 一 个 重要 性 质 是 用 于 推导 构造 Yoronoi 图 的 算法 时 间 复 杂 度 。 该 性 质 是 : 
Voronoi 图 的 边 数 至 多 是 3n 一 6， 其 中 n 是 上 点数。 注意 ， 每 个 Yoronoi 图 与 一 个 Delaunay 三 角 齐 分 
对 应 。 由 于 Delaunay 三 角 剖 分 是 平面 图 。 它 至 多 包含 3 一 6 条 边 。 因 为 在 Yoronoi 图 中 的 边 与 
Delaunay 三 角 齐 分 的 边 之 间 一 一 对 应 ， 所 以 在 Voronoi 图 中 的 边 数 至 多 是 34 一 6。 

在 得 到 Voronoi 边 的 上 界 后 ， 可 推导 Voronoi 顶 点 的 上 界 。 注 意 ， 每 个 Voronoi 顶 点 都 与 
Delaunay 三 角 剖 分 中 的 一 个 三 角形 对 应 。 由 于 Delaunay 三 角 剖 分 是 个 平面 图 ， 可 将 剖 分 看 作 此 
平面 图 的 一 个 面 。 令 FF、E 和 V 分 别 表示 Delaunay 三 角 剖 分 的 面 数 、 边 数 和 点 数 ， 那 么 根据 欧 拉 
关系 式 (Euler relation); F = E-V + 2。 在 Delaunay 三 角 训 分 中 ，V = n， 以 及 E 至 多 为 3n 一 6。 
所 以 ，F 至 多 为 (3n 一 6)--n + 2 = 2 一 4。 也 就 是 ，VYoronoi 顶 点 数 至 多 为 20 一 4。 

现在 已 准备 好 推导 合并 过 程 的 时 间 复 杂 度 。 谨 记 在 合并 过 程 中 ， 必 须 找 出 两 个 凸 包 。 在 
4.3 节 所 介绍 的 算法 在 此 不 能 使 用 ， 因 为 它 的 时 间 复 杂 度 是 O(n log n)， 这 距离 我 们 的 目标 太 高 
了 。 现 在 将 说 明 能 很 容易 地 找 出 这 些 凸 包 ， 因 为 YD(5,) 和 VD(5R) 可 用 于 构造 这 些 同 包 。 

参见 图 4-25 所 示 的 有 四 条 无 限 射 线 的 Voronoi 图 ， 即 5/,。、b1s、bse 和 b2。， 与 这 些 无 限 射线 对 
应 的 点 是 P,、P1、Ps 和 P。。 实 际 上 ， 可 以 通过 连接 这 些 点 构造 凸 包 ， 如 图 4-25 所 示 的 虚线 。 

在 构造 了 Voronoi 图 之 后 ， 通 过 检查 所 有 的 Voronoi 边 直到 找 出 一 条 无 限 射线 ， 就 可 以 构造 
HET., RP, 是 此 无 限 射线 左边 的 一 点 ， 那 么 P 就 是 一 个 册 包 顶点 。 现 在 检查 P 的 Voronoi 多 边 
形 的 Voronoi 边 ， 直 到 发 现 -一 条 无 限 的 射线 。 上 面 的 过 程 重复 直至 返回 到 开始 的 射线 为 止 。 由 
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于 每 条 边 一 定 出 现在 两 个 Yoronoi 多 边 形 上 ， 不 存在 边 被 检查 多 过 两 次 。 因 此 ， 在 构造 Voronoi 
AZE, LTANMOMARH GS, 

构造 基于 分 治 策略 的 Voronoi 图 的 算法 的 
合并 步骤 的 时 间 复 杂 度 可 以 推导 如 下 : 

(1) 因为 VD(S) 和 VYD(S 业 已 构造 ， 所 以 
凸 包 可 在 O0o) 时 间 内 找 出 ， 且 通过 找 无 限 射 
EI T DE. 

(2) AT ha HER PT BENA 
By EO(n) IT RA ie, TEE APE E4345 。 

(3) AFEVD(S,)AnVD(S,) FBS Fi 3n—-6 
条 边 ， 且 HP 至 多 包含 k 条 线段 (因为 HP 对 于 
y 的 单调 性 )，HP 的 整个 构造 过 程 化 费 至 多 
O(n) 步 。 

因此 ，Voronoi 图 构造 算法 的 合并 过 程 是 
O(n)， 因 此 图 4-25 从 Voronoi 图 构造 凸 包 

T(n) = 2T(n/2) + O(n) = O(n log n) 

我 们 得 出 结论 : 构造 Voronoi 图 的 分 治 算法 时 间 复 杂 度 是 O(n log n)。 现 在 说 明 该 算法 是 最 
优 的 。 考 虑 一 条 直线 上 的 点 集 ， 这 样 点 集 的 Voronoi 图 是 由 如 图 4-26 所 示 的 平分 线 集 所 组 成 。 在 
这 些 线 构成 之 后 ， 对 于 这 些 Voronoi 边 的 线性 扫描 将 完成 排序 功能 。 换 名 话说 ，Voronoi 图 问题 
不 比 排序 问题 容易 。 所 以 ，Voronoi 图 问题 的 下 界 是 Q(n log n)， 因 此 ， 该 算法 是 最 优 的 。 


b2 by 
oe 
P) Py Py 


图 4-26 直线 上 点 集 的 Voronoi 图 
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4.5 Voronoi 图 的 应 用 


我 们 已 经 讨论 了 Voronoi 图 的 概念 ， 并 且 已 经 说 明了 如 何 将 分 治 策略 用 于 构造 Yoronoi 图 。 
在 本 节 中 ， 将 说 明 Voronoi 图 有 许多 有 趣 的 应 用 。 当 然 ， 这 些 应 用 与 分 治 策略 无 关 。 通 过 介绍 
Voronoi 图 的 这 些 应 用 ， 和 希望 激发 大 家 对 计算 几何 的 兴趣 。 

欧 几 里 得 近邻 搜索 问题 

第 一 个 应 用 是 解决 欧 几 里 得 近邻 搜索 问题 (Euclidean Nearest Neighbor Searching Problem) , 
该 问题 定义 如 下 : 已 知 平面 上 1 个 点 集合 : Pl，P,，…，P, 和 一 个 检测 点 P， 在 Pi 中 找 出 P 的 最 
近邻 居 ， 比 较 的 距离 是 欧 几 里 得 距离 。 

直接 的 方法 是 进行 穷 举 搜索 ， 该 算法 是 O(n) 时 间 的 算法 。 使 用 Voronoi 图 ， 能 减少 搜索 时 间 
为 O(log n)， 而 预 处 理 时 间 为 O(n log n), 

因为 Voronoi 图 的 基本 性 质 ， 可 以 使 用 Voronoi 图 来 解决 欧 几 里 得 近邻 搜索 问题 。 注 意 ， 
Voronoi 图 将 整个 平面 划分 成 RI，R;,，…，R, 个 区 域 。 在 每 个 区 域 R, 内 ， 有 一 个 点 P;。 如 果 测 试 
点 落 在 区 域 R, 内 ， 那 么 在 所 有 点 中 ， 它 的 最 近邻 点 就 是 P;。 因 此 ， 可 以 通过 简单 地 将 该 问题 转 
换 为 一 个 区 域 定位 问题 (region location problem) 而 避免 穷 举 搜索 。 也 就 是 ， 如 果 能 够 确定 检 
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测 点 P, 位 于 哪个 区 域 K,， 就 能 确定 该 检测 点 的 最 近邻 居 。 

Voronoi 图 是 个 平面 图 ， 所 以 可 使 用 如 图 4-27 所 示 的 平面 图 的 特殊 性 质 。 在 图 4-27 中 ， 
Voronoi 图 是 图 4-22 的 重 画 。 注意 到 共有 六 个 Voronoi 顶 点 。 第 一 步 是 对 这 些 顶 点 根据 其 y 值 排序 。 
如 图 4-27 所 示 ，、 根 据 递减 的 y 值 ，Voronoi 顶 点 标记 为 VY/,，V;，…，V。。 通 过 每 个 Voronoi 顶 点 ， 
画 一 条 水 平 线 ， 这 些 水 平 线 将 整个 空间 分 割 成 如 图 4-27 所 示 的 片 隙 。 

在 每 个 片 陆 肉 ， 有 可 以 线性 排序 的 Voronoi 边 ， 且 这 些 Voronoij 边 可 再 分 割 片 随 为 区 域 ， 参 
见 图 4-27 中 的 SLs;。 在 SL 内 ， 有 三 条 Voronoi 边 : 5 、Ps 和 ps。 它们 可 排序 成 

pas<bu<b 


， bis 
SL, vi 





图 4-27 _Voronoi 图 解决 欧 几 里 得 近邻 搜索 问题 的 应 用 


这 三 条 边 将 片 隙 分 割 成 四 个 区 域 : R,, Ry, RUR.. 如 果 在 边 b,3 和 b3» 间 找 出 一 点 ， 那么 它 
一 定 在 区 域 R 中 。 如 果 发 现 它 在 bs 的 右边 ， 那 么 它 必 定 在 区 域 Re 中 。 由 于 这 些 边 是 有 序 的 ， 只 
要 考虑 这 些 Voronoi 边 ， 就 可 使 用 二 分 查找 来 确定 检测 点 的 位 置 。 

欧 几 里 得 近邻 搜索 算法 基本 上 是 由 两 个 主要 的 步骤 组 成 

(1) 进行 二 分 查找 以 确定 检测 点 在 哪 一 个 片 隙 内 ， 由 于 至 多 有 O(n) 个 Voronoi 顶 点 ， 所 以 这 
P CERT [al O(log n) 内 完成 。 - 

(2) 在 每 个 片 阶 肉 ， 进 行 二 分 查找 以 确定 该 点 在 哪 一 个 区 域 ， 由 于 至 多 有 CO(D 个 Yoronoi 顶 
点 ， 所 以 这 可 在 时 间 O(log n) 内 完成 。 

总 的 搜索 时 间 是 O(log n)， 很 容易 看 到 预 处 理 时 间 是 O(n log n)， 这 基本 上 是 构造 Voronoi 图 
所 需 的 时 间 。 
欧 几 里 得 所 有 近邻 问题 

接 下 来 的 应 用 是 解决 欧 几 里 得 所 有 近邻 问题 (Euclidean all nearest neighbor problem), 已 
知 平面 上 的 nm 个 点 集合 ， Pi ，P,，…，P,。 欧 几 里 得 最 近 点 对 问题 是 找 出 每 个 P 的 最 近邻 点 。 由 
于 Voronoi 图 下 面 的 性 质 ， 该 问题 可 使 用 Voronoi 图 很 容易 地 解决 ， 如 果 忆 是 已 的 最 近邻 点 ， 那 么 
P 和 PP 共享 同一 条 Voronoi 边 。 而 且 ， PP, 的 中 点 正好 位 于 此 共享 Voronoi 边 上 。 我 们 采用 反 证 法 
证 明 该 性 质 。 假 如 已 和 已 没有 共用 同一 条 Voronoi 边 ， 根 据 Voronoi 多 边 形 的 定义 ， PP WHEAT 
分 线 一 定 在 与 P 相 关 的 Voronoi 多 边 形 的 外 部 。 令 BP 与 平分 线 相交 在 点 M， 与 某 Voronoi 边 交 于 
点 YN， 如 图 4-28 所 示 。 








y 
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图 4-28 Voronoi 图 的 近邻 性 质 的 举例 
假如 Voronoi 边 在 P: 和 Pi 之 间 ， 且 BB 与 Voronoi 边 相交 于 点 L， 那 么 得 到 
PN< PM 

和 PL<PN. 

这 意味 着 





PP = 2PL<2PN<2PM = PP 


这 是 不 可 能 的 ， 因 为 P 是 Pi 的 最 近邻 居 。 IAP, SP, UR ARP EP AOL 

已 知 上 面 的 性 质 ， 欧 几 里 得 所 有 近邻 问 
题 可 通过 考查 每 个 Voronoi 多 边 形 的 每 条 边 来 
解决 。 由 于 每 条 Voronoi 边 一 定 是 两 个 
Voronoi 多 边 形 共享 ， 没 有 Voronoi 边 检验 多 
过 两 次 。 也 就 是 ， 在 Voronoi 图 构造 之 后 ， 欧 
几 里 得 所 有 近邻 问题 可 在 线性 时 间 内 解决 。 
因此 ， 该 问题 可 在 O(n log DD 时 间 内 求解 。 

现在 重 画 图 4-22 在 图 4-29 中 。 对 于 Ps， 
四 条 边 必 须要 检验 ， 找 出 Ps 的 近邻 是 P;。 


46 快速 侍 里 叶 变 换 
快速 传 里 叶 变 换 问 题 (Fast Fourier 
Transform problem) 是 计算 下 面 的 公式 : 图 4-29 所 有 近邻 关系 


n- 2 


A= Dae ” 0<j<n-l 








其 中 i = JI, Ha, a, o, a, | 是 已 知 数 。 直 接 的 计算 方法 将 需要 O(n ) 的 步 数 。 如 果 使 用 分 
治 策略 ， 那 么 时 间 复 杂 度 可 减少 到 O(n log n). 
2 
为 了 简化 讨论 ， 令 w, = e”。 这 样 ， 傅 里 叶 变 换 就 是 计算 下 式 ，; 
A= ay +t aw +a,w,! feta, worl 
Ag = dta, + A, + A; 
A, = dy t4,Wy+G,Wy +4,Wy 


2 4 6 
Ay = dy + QW, +a,w, +a,w, 
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Ww 
A 
+ 





A= ap +awj +a +a,w, 
可 以 重新 调整 上 面 的 公式 为 下 面 的 形式 : 

Ay = (dy + ay) + (a, + a;) 

A, = (a, +4,w,)+w,(a, + aw?) 
A, = (dy +@,w,)+wi(a, +a,w;) 
A;= (ay) +a,w?) + wy(a, +awe) 

由 于 w = Win wi = ws ， 可 得 

Ag = (ao + a3) + (a, + a;) 

A, = (dp + aw) + w,(a, + qa3w,) 
A, = (a) +a,)+w,(a, +a) 

A, = (a, +@,w,) + wila +a,W,) 


3 
= (a) +.a,w,)+w;(a, +a,w,) 


令 
Ay = Ay + ay 
Cy = a, + a, 
B, = Go + aw, 
C =a, + aw, 
那么 ， 
Ay = By + wi, 
A, =B,+ wiC, 
A, = By + wiCo 
A=B, + w,C, 


上 面 的 公式 表明 分 治 策略 可 以 漂亮 地 应 用 到 解决 傅 里 叶 变 换 问题 中 。 只 需 计 算 B6、Co、 

和 C,， 那 么 4 就 可 很 容易 地 得 到 。 换 句 话 说 ， 一 旦 得 到 A。， 那 么 4 就 立即 得 到 。 类 似 地 ， 一 
得 到 A,， 那 么 4; 也 直接 可 得 到 。 

BÈ, BAC 是 什么 ?注意 到 B, 是 奇数 输入 项 的 依 里 叶 变 换 ， 而 C; 是 偶数 输入 项 的 傅 里 时 
变换 ， 这 是 应 用 分 治 策略 解决 健 里 叶 变 换 问 题 的 基础 。 将 大 问题 划分 为 两 个 子 问题 ， 递 归 地 解 
决 这 两 个 子 问题 ， 再 合并 它们 的 解 。 

考虑 一 般 情况 下 的 4。 


_ i 2j 
Aj= ao +W; taw ++, Ww, 


(a-lDi 


= 27 4j (n-2)j i (n-2)j 
= (a + aw: +aw, + + a WwW, ) 十 wila taw + dsw’ i4. 二 GT 


n- 
n-2)j (n-2)j 


i 2j 2 i i 2j ga. 2 
= (a + Wiig FAW p FF Ay Wai + “le + OW 十 05W072 to + Ty Waid 


定义 Bj 和 Cj 如 下 : 
Uy 
B= a+ Cj Go HFG, Wri 
2 
和 C = a, +4,w!, +a Wih ++ A, Wz 
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A;=B,+ wiC, 


nj 


还 可 证 明 
Aisn = B;+ wit. 
对 于 n = 2， 侍 里 叶 变 换 如 下 : 
Ay = do + a 
A, =a)~ 4, 


基于 分 治 法 的 傅 里 叶 算法 表示 如 下 : 





算法 4-6 ”基于 分 治 策略 的 快速 傅 里 时 变换 


ot 
输入 : aos Ay Co REZ, 
nl 2 


输出 : 4, = yu " , M4y=0, 1, 2, 07, acd. 





步骤 1. 如 果 n = 2, 
Ay = A+ a, 
Ay =a, 
返回 。 
步骤 2. 递归 地 找 出 wo，w ，…，a-za，…，awr-0) 的 傅 果 叶 变换 系数 。 令 系数 表示 成 Bg，B，…，Bpa(Co，C， 
ee, Cn)o 
步骤 3. For j = 0 to j = n/2-1 
A;=B;+ wil, 


j+ni2 
Aja ur = B, + Wa C, o 





上 面 算法 的 时 间 复杂 度 显然 是 O(n log n)。 伟 里 叶 变 换 逆 变 换 是 将 46。，A|，…，A4,_, 按 如 下 
FVM ay, ais tts Anio 





1 n=l -2mjk 


a= ma^ “对 于 j=0, 1, 2, =, nol 


考虑 一 个 例子 ， 令 we = 1，al =0，a = 一 !，a =0， 那 么 
Bo =ay)+a,=1+(-1=0 

B, = a —a, = 1-(-1) =2 

Cyo=a,+a,=0+0=0 

C, =a, —a,=0-0=0 


wa = wei 
e 
w? = 一 | 
w =—i 
因此 ， 


Ay = By + WiCy = Bo + Cy =0+0=0 
A, =B,+w,C,=2+0=2 
A, = By, + wC =0 —-0=0 
A=B + wiC, =2+0=2 
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4.7 实验 结果 


为 了 说 明 分 治 策略 是 个 很 有 用 的 策略 ， 我 们 实现 了 基于 分 治 策略 的 最 近 点 对 算法 和 穷 举 检 
验 每 对 顶点 的 直接 算法 。 两 个 程序 都 是 在 IBM 个 人 计算 机 上 实现 的 ， 如 图 4-30 总 结 了 实验 结果 。 
如 图 4-30 所 示 ， 当 mn 较 小 时 ， 直 接 方法 实现 得 较 好 。 但 是 ， 随 着 "的 增 大 ， 分 治 算法 将 更 快 。 例 
如 ， 当 1 等 于 7000 时 ， 分 治 算法 几乎 比 直接 方法 快 了 200 倍 。 这 样 的 结果 是 可 以 预测 的 ， 因 为 直 
接 算法 的 时 间 复 杂 度 是 O(n”)， 而 分 治 算法 的 时 间 复 杂 度 是 O(n log n). 


40 000 


35 000 / 
~ 一 一 直接 比较 法 


一 一 一 分 治 法 ‘ 


30 000 , 








25 000 


20 000 


CPU 时 间 (毫秒 ) 


15 000 


10 000 


5 000 
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图 4-30 求 最 近 点 对 问题 的 实验 结果 


4.8 注释 与 参考 


分 治 策略 经 常用 于 解决 计算 几何 问题 ， 可 参阅 文献 Preparata and Shamos (1985) 和 Lee and 
Preparata (1984)。 分 治 策略 也 在 文献 Horowitz and Sahni(1978) 和 Aho，Hopcroft and Ullman 
(1974) 中 讨论 。 

关于 极 大 值 问题 的 完全 讨论 ， 参 阅 文献 Pohl(1972)。 最 近 点 对 问题 和 求 极 大 值 问题 也 在 文 
献 Bentley(1980) 中 解决 。 

Voronoi 图 首先 在 文献 Voronoi(1908) 中 讨论 。 另 外 ， 关 于 Yoronoi 图 的 更 多 信息 可 在 文献 
Preparata and Shamos(1985) 中 找到 。 对 于 Voronoi 图 的 更 高 阶 和 更 高 维 的 一 般 性 讨论 ， 可 参阅 文 
献 Lee(1982) 和 Brown(1979)。 

不 同 的 凸 包 算法 可 在 文献 Levcopoulos and Lingas(1987) 和 Preparata and Shamos(1985) 中 找 


到 。Graham 扫 描 在 文献 Graham(1972) 中 提出 。3 维 止 包 也 可 由 分 治 策略 找 出 ， 这 由 文献 
Preparata and Hong(1977) 提 出 。 








D it RG 83 





通过 分 治 法 解决 傅 里 时 变换 有 文献 Cooley and Tukey(1965), 3¢#ikGentleman and Sande 
(1966) 讨 论 了 快速 传 里 叶 变 换 的 应 用 。Brigham 的 书 (Brigham, 1974) 是 完全 地 对 快速 侍 里 叶 
变换 的 介绍 。 

分 治 也 可 用 于 计算 有 效 的 矩阵 相 乘 算 法 ， 参 见 文献 Strassen(1969)。 


4.9 进一步 的 阅读 资料 


对 于 许多 研究 者 分 治 策略 仍然 是 有 吸引 力 的 主题 ， 它 对 计算 几何 特别 有 效 。 推 荐 下 面 的 论 
文 作 进一步 研究 ， Aleksandrov and Djidjex (1996); Bentley (1980); Bentley and Shamos 
(1978); Blankenagel and Gueting (1990); Bossi, Cocco and Colussi (1983); Chazelle, 
Drysdale and Lee (1986); Dwyer (1987); Edelsbrunner, Maurer, Preparata, Rosenberg, Welzl 
and Wood (1982); Gilbert, Hutchinson and Tarjan (1984); Gueting (1984); Gueting and 
Schilling (1987); Karp (1994); Kumar, Kiran and Pandu (1987); Lopez and Zapata (1994), 
Monier (1980); Oishi and Sugihara (1995); Reingold and Supowit (1983); Sykora and 
Vrto(1993); Veroy (1988); Wslsh (1984); and Yen and Kuo (1997), 

对 于 一 些 最 新 出 版 的 论文 感 兴趣 可 参阅 Abel (1990); Derfel and Vogl (2000); Dietterich 
(2000); Even, Naor, Rao and Schieber(2000); Fu (2001); Kamidoi, Wakabayashi and Yoshida 
(2002); Lee and Sheu (1992) Liu (2002); Lo, Rajopadhye, Telle and Zhong (1996); Melnik 
and Garcia-Molina (2002); Messinger, Rowe and Henry (1991); Neogi and Saha (1995); Rosler 
(2001); Rosler and Ruschendorf (2001); Roura (2001); Tisseur and Dongarra (1999), Tsai and 
Katsaggelos (1999); Verma (1997); Wang (1997); Wang (2000); Wang, He, Tang and Wee 
(2003); Yagle (1998); and Yoo, Smith and Gopalarkishnan (1997), 


习题 
4.1 二 分 查找 可 使 用 分 治 策略 吗 ? 
4.2 直接 将 两 个 "比特 数 x 和 * 相 乘 需要 O(i) 步 数 。 使 用 分 治 方法 ， 可 将 数 划分 成 两 个 相等 的 部 分 ， 
通过 下 面 的 方法 计算 乘积 : 
uv=(a- X? + b) - (c - X? 4+d)=ac - 2+(ad+bc): 2"? + bd 
如 果 将 ad + bc 计算 成 (a+ b)(c + 四 -ac-pd， 计 算 时 间 是 多 少 ? 
4.3 证 明 : 在 快速 排序 中 ， 需 要 的 最 大 栈 是 OUog n). 
4.4 实现 基于 分 冶 法 的 快速 傅 里 叶 转 换算 法 ， 并 与 直接 方法 做 比较 。 
4.5 实现 基于 分 治 法 的 找 秩 算 法 ， 并 与 直接 方法 做 比较 。 


2 
4.6 a (Z) =o +b, 其 中 是 一 个 整数 ， 且 r> 1， 计 算 Tom)。 
4.7 参阅 文献 Horowitz and Sahni(1978) 的 3.7 节 ， 了 解 基 于 分 治 的 Strassen 和 给 阵 乘法 。 


4.8 令 


Tn) = b 对 n=1 
= arora rb 对 n>1 


其 中 a、b 和 c 都 是 非 负 常数 。 
证 明 : 如 果 " 是 c 的 寡 时 ， 那 么 
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#49 
O(n) 如 果 a<c 

T(n) = 10(nlog,n) ”如 果 a=c 
Oln") wk a>c 


4.9 证 明 : 如 果 T(n) = mT(n/2) + an’, BATRE 


Own?) 如 果 m>4 
OU logn) 如 果 m=4 
O(n’) 如 果 m<4 


T(n) = 





4.10 一 种 基于 分 治 的 特殊 排序 算法 是 奇偶 合并 排序 (odd-even merge sorting) ， 由 Batcher(1968) 发 


明 。 对 于 该 排序 算法 ， 参 阅 文献 Liu(1977) 的 7.4 节 。 该 排序 算法 适合 作为 顺序 算法 吗 ? 为 什 
A? (这 是 个 著名 的 并 行 排序 算法 。) 


4.11 对 于 n 个 数 的 序列 ， 设 计 一 个 O(n log n) 时 间 的 算法 ， 找 出 最 长 的 单调 递增 的 子 序列 





第 5 章 树 搜索 策略 


在 本 章 中 ， 将 说 明 有 许多 问题 的 解 可 以 用 树 来 表示 ， 因 此 解决 这 些 问 题 就 变 成 了 树 搜索 问 
题 (tree searching problem) 。 我 们 首先 研究 将 在 第 8 章 讨 论 的 可 满足 性 问题 (satisfiability 
problem) ， 已 知 一 个 子 名 集 (set of clauses) ， 确 定 这 个 子 句 集 是 否 可 满足 的 一 种 方法 是 考查 所 
有 可 能 的 指派 (assignment)。 也 就 臣 ， 如 果 有 n 个 变量 x,，x,，，…，x,， 那 么 简单 地 测试 所 有 可 
能 的 2 个 指派 。 在 每 个 指派 中 ，x 可 指派 为 ?或 者 F。 假 如 4 = 3， 需 要 考查 下 列 指派 ， 


x, x; x; 
F F F 
F F T 
F T F 
F T T 
T F F 
T F T 
T T F 
T T T 


另 一 方面 ， 上 面 这 8 个 指派 可 以 用 一 棵 树 表示 ， 如 图 5-1 所 示 。 为 什么 该 树 能 具有 这 么 丰富 
的 信息 呢 ? 这 些 指派 的 树 表 示 说 明 在 顶 宏 ， 确 实 有 两 类 指派 : 

类 1， 那些 xz = 7 的 指派 。 

类 2: 那些 x, = F 的 指派 。 





图 5-1 八 个 指派 的 表示 


这 样 ， 能 递归 地 对 每 类 指派 划分 成 两 个 子 类 。 基 于 这 样 的 观点 ， 只 需 确定 指派 的 所 有 分 类 
而 不 用 去 考查 所 有 的 值 ， 就 能 确定 其 可 满足 性 。 例 如 ， 假 定 有 下 面 的 子 句 集 : 


=x] (1) 
xı (2) 
X2 V Xs (3) 
X3 (4) 


A (5) 
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现在 可 画 出 一 棵 部 分 树 ， 如 图 $-2 所 示 。 

从 图 5-2 所 示 的 树 中 ， 可 容易 地 看 到 x, = 7 的 指派 将 不 满足 子 句 (1)， 而 x, = F 的 指派 将 不 满 
是 子 名 (2)。 由 于 在 每 个 指派 中 ，xi 只 能 指派 为 7 或 FF， 所 以 
不 需要 测试 每 .个 指派 。 那 么 ， 现 在 可 确定 上 面子 句 集 的 
不 可 满足 性 。 

许多 其 他 相似 的 问题 也 可 通过 树 的 搜索 技术 解决 。 考 
虑 有 名 的 8 数码 问题 (8-puzzle problem) 。 在 图 5-3 中 展示 了 
一 个 正方 形 结构 ， 它 包含 有 九 个 格子 ， 仅 有 八 个 格子 有 数 oo 
字 ， 有 一 个 空格 子 。 这 里 的 问题 是 移动 这 些 带 数字 的 小 方 。 图 5-2 确定 可 满足 性 问题 的 部 分 树 
块 ， 使 得 能 到 达 如 图 5-4 所 示 的 终 态 。 这 些 带 数字 的 小 方块 仅 能 水 平 或 垂直 移动 到 空 的 方 格 中 。 
这 样 ， 对 于 如 图 $-3 所 示 的 初始 状态 ， 仅 有 两 种 可 能 的 移动 如 图 5-5 所 示 。 





(1) 证 明 为 假 (2) 证 明 为 假 








图 5-3 一 个 8 数码 的 初始 安排 图 5-4 此 8 数码 问题 的 日 标 状态 

这 样 ， 该 8 数码 问题 变 成 了 一 个 树 搜索 问题 ， 因 为 可 以 逐渐 扩展 这 棵 解 树 。 只 要 表示 最 终 
目标 的 结 点 出 现 ， 那 么 问题 就 解决 了 。 在 后 面 几 节 中 将 详 述 这 些 内 容 。 

最 后 ， 将 说 明 哈密 顿 回 路 问题 (Hamiltonian cycle problem) 的 解 空间 也 能 用 一 棵 树 方便 地 
表示 。 已 知 图 G = (VE) 是 有 n 个 顶点 的 连通 图 。 哈 密 顿 回路 是 一 条 环形 路 径 ， 经 过 图 G 的 n 个 
顶点 ， 并 且 每 个 顶点 仅 访问 一 次 ， 最 终 回 到 最 初 的 位 置 。 参 见 图 5-6 所 示 ， 通 过 下 列 序列 表示 
的 路 径 是 一 条 哈 窗 顿 回路 : 1，2，3，4，7，5，6 ，1。 在 图 5-7 中 ， 没 有 哈密 顿 回 路 。 

哈密 顿 回路 问题 是 确定 在 一 个 已 知 的 图 中 是 否 包含 哈密 顿 回 路 。 这 是 一 个 NP 完全 问题 。 
它 仍 然 能 通过 测试 所 有 可 能 的 解 来 解决 ， 并 且 这 些 解 可 方便 地 用 一 棵 树 来 表示 。 注 意 ， 哈 密 顿 
回路 一 定 要 访问 图 的 每 个 结 点 ， 因 此 可 假定 结 点 1 是 开始 结 点 。 再 次 参见 图 5-6， 哈 窗 顿 回路 的 
搜索 可 通过 一 棵 树 来 描述 ， 如 图 5-8 所 示 。 由 于 回路 !，2，3，4，7，5，6，1 与 回路 1!，6,，5， 
7，4，3，2，1 是 相同 的 ， 因 此 ， 说 明 存 在 一 条 并 且 仅 存在 一 条 哈密 顿 回 路 。 





图 5-5 8 数码 问题 的 最 初 安排 的 两 个 可 能 移动 
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图 5-6 一 个 包含 哈密 顿 回路 的 图 图 5-7 一 个 不 包含 哈密 顿 回路 的 图 











图 5-8 在 图 5-6 中 的 图 是 否 存在 哈密 顿 回路 的 树 表示 


考查 图 5-7， 是 否 存在 一 棵 对 应 该 图 的 哈密 顿 回路 的 树 
表示 在 图 $-9 中 。 此 次 ， 很 容易 能 看 出 不 存在 一 条 哈密 顿 回 
路 。 

业已 证 明 许 多 问题 都 能 通过 树 来 表示 。 在 本 章 的 剩余 
部 分 中 ， 将 讨论 解决 这 些 问 题 的 剪 枝 树 策略 (strategy of 


pruning tree), 


5.1 广度 优先 搜索 


广度 优先 搜索 (breadth-first search) 也 许 是 剪 枝 一 棵 树 
最 直接 的 方法 。 在 广度 优先 搜索 中 ， 树 中 某 一 层 的 所 有 结 
点 在 考查 下 一 层 所 有 结 点 以 前 被 考查 。 图 5-10 表 示 一 个 典型 
的 解决 8 数码 问题 的 广度 优先 搜索 。 

注意 到 结 点 6 表示 一 个 目标 结 点 。 因 此 ， 搜 索 将 停止 。 

广度 优先 搜索 的 基本 数据 结构 是 一 个 能 容纳 所 有 扩展 
结 点 的 队列 。 下 列 方案 说 明了 广度 优先 搜索 。 图 9 AEEA a PO 








wy 
wa 
“eh 








图 5-10 通过 广度 优先 搜索 产生 的 搜索 树 


广度 优先 搜索 
步骤 1. 构造 由 根 结 点 组 成 的 1 元 队列 。 
步骤 2. SARA BA-TRRAG A EE. MR. MAbs GU, RAPS, 
步骤 3. MIZA APARE- POR, RAMI, UR — TCR a CH ABA FR Io 
ERA 如 果 该 队列 是 空 的， 那么 失败 ， 否 则 ， 转 去 步骤 2。 





5.2 深度 优先 搜索 


深度 优先 搜索 (depth-first search) 总 是 选择 最 深 的 结 点 展开 。 考 虑 下 面 的 子 集 和 问题 
(sum of subset problem), BARAS = {7, 5, 1, 2, 10}, 确定 是 否 存在 元 素 和 等 于 9 的 子 集 5'。 
这 个 问题 可 通过 深度 优先 搜索 容易 地 解决 ， 如 图 5-11 所 示 。 在 图 5-11 中 许多 结 点 被 终止 ， 显 而 
易 见 因为 它们 不 能 产生 问题 的 解 。 图 5-11 中 每 个 圆圈 中 的 数字 代表 一 个 子 集 和 。 注 意 在 这 个 过 
程 中 ， 总 是 选择 最 深 的 结 点 进行 扩展 。 

现在 考虑 哈密 顿 回路 问题 。 对 于 图 $-12， 通 过 深度 优先 搜索 找 出 一 条 哈密 顿 回 路 ws 
5-13 所 示 。 





图 5-11 通过 深度 优先 搜索 解决 子 集 和 问题 图 5-12 一 个 包含 哈密 顿 回路 的 图 
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图 5-13 通过 深度 优先 搜索 产生 的 哈密 顿 回路 
总 结 深 度 优先 搜索 如 下 : 


深度 优先 搜索 
步骤 1. 构造 由 根 结 点 组 成 的 1 元 栈 。 
步骤 2. 考查 该 栈 的 栈 顶 元 素 是否 日 标 结 点 。 如 果 是 ， 那 么 停止 ， 否 则 ， 转 去 步骤 3。 
PRS. 从 该 栈 中 移 除 顶 元 素 ， 如 果 有 后 代 ， 将 其 增加 到 该 栈 顶 。 
步骤 4. 如 果 该 栈 是 空 的 ， 那 么 失败 ， 否 则 ， 转 去 步 蛇 2。 


5.3 RU 


在 阅读 完 深度 优先 搜索 这 节 后 ， 读 者 也 许 想 知道 ， 在 所 有 的 后 代 结 点 中 ， 选 择 哪 一 个 结 点 
扩展 ?在 本 节 将 介绍 一 种 方法 ， 称 为 不 山 法 (hill climbing)。 疏 出 法 是 深度 优先 搜索 的 一 种 变 
形 。 在 这 种 方法 中 ， 使 用 某 种 贪心 法 来 帮助 我 们 决定 在 搜索 空间 中 向 哪 一 个 方向 移动 。 通 常 ， 
贪心 法 使 用 一 些 启 发 式 的 方法 对 各 种 可 能 的 选择 排序 。 启 发 式 的 方法 越 好 ， 诡 山 法 也 越 好 。 

再 次 考虑 8 数码 问题 。 假 如 贪心 法 使 用 下 面 简单 的 评价 函数 (evaluation function) f(n) 确 定 
选择 的 次 序 : 

f(n) = wln) 
其 中 w(n) 是 结 点 n 错 误 放置 的 方 格 数 。 这 样 ， 假 如 开始 结 点 如 图 5-14 所 示 放 置 ， 因 为 1，2 和 8 是 
错误 放置 的 ， 所 以 f MEF. 

图 5-15 所 示 的 是 应 用 扑 出 法 的 结果 ， 该 方法 使 用 /作为 启发 ， 
在 结 点 的 所 有 后 代 中 做 出 选择 的 次 序 ， 每 个 结 点 /的 值 如 图 $-15 
所 示 。 在 每 条 边 上 ， 结 点 扩展 的 顺序 也 标注 了 。 注 意 扑 出 法 仍 
然 采 用 深度 优先 搜索 ， 只 是 在 这 个 结 点 的 所 有 后 代 中 ， 疏 山 法 
选择 局 部 最 优 的 结 点 去 扩展 。 

读者 不 应 该 得 出 申 山 法 是 极其 有 效 的 错误 印象 ， 因 为 图 5$-15 图 5-14 8 数码 问题 的 开始 结 点 
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所 示 的 例子 是 这 样 的 。 在 图 5-15 中 ， 在 最 先 被 扩展 的 结 点 中 有 两 个 结 点 有 相同 的 评价 值 。 假 如 
扩展 另 一 个 结 点 ， 那 么 需要 更 长 的 时 间 才 能 得 到 解 。 





F ER ADS 


图 5-15 ATELA ATR 8 AAB [| 





息 山 法 的 方案 
FRI 构造 由 根 结 点 组 成 的 1 元 栈 。 
步骤 2. 考 往 该 栈 的 栈 顶 元 素 是 否 月 标 结 点 。 如 果 是 ， 那 么 停止 ， 否则， 转向 步 又 3。 
步骤 3. 从 该 栈 中 删除 栈 顶 元 素 并 扩展 该 元 素 ， 增 加 该 元 素 的 后 代 到 该 栈 中 ， 进 栈 的 次 序 依据 评价 函数 值 。 
步骤 4. 如 果 该 楼 是 空 的 ， 那 么 失败 ， 否 则 ， 转 向 步骤 2。 


5.4 最 佳 优先 搜索 策略 


最 佳 优 先 搜索 策略 (best-first search strategy) 是 将 深度 优先 和 广度 优先 搜索 优点 进行 组 合 
而 成 的 一 种 简单 方法 。 在 最 佳 优先 搜索 中 ， 有 一 个 评价 函数 ， 总 是 选择 到 目前 为 止 产生 的 所 有 
结 点 中 具有 最 小 代价 的 结 点 。 可 以 看 出 最 佳 优先 搜索 不 像 仆 山 法 ， 它 具有 全 局 观点 。 


最 佳 优先 搜索 方案 


步骤 1. 使 用 评价 函数 构造 一 个 堆 ， 首 先 构造 由 根 结 点 组 成 的 1 元 堆 。 

步骤 2. EZERRE SEPE. WERE, WARE GM, KAP, 
PR. 从 该 堆 中 删除 根 元 素 ， 并 扩展 该 元 素 ， 把 这 个 元 素 的 后 代 添 加 到 堆 中 。 
步骤 4. WEEE, BARR, BM, Bri, 





如 果 在 最 佳 优 先 搜索 中 ， 使 用 与 假山 法 相同 的 启发 式 方法 ， 那 么 8 数码 问题 的 解 如 图 5-16 
所 示 。 
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图 5-16 用 最 佳 优先 搜索 方法 解决 8 数码 问题 


5.5 分 支 限 界 策略 


在 前 面 几 节 中 ， 我 们 使 用 树 搜索 技术 解决 了 许多 问题 。 这 些 问题 都 不 是 优化 问题 。 使 读者 
感 兴趣 的 是 注意 到 上 面 的 方法 都 不 能 用 于 解决 任何 优化 问题 (optimization problem) 。 在 本 节 
中 ， 将 介绍 分 支 限界 策略 (branch-and-bound strategy) ， 这 也 许 是 解决 一 大 类 组 合 问题 的 最 有 
效 策略 之 一 。 基 本 上 ， 该 策略 表明 问题 可 能 有 许多 可 行 解 (feasible solution) 。 然 而 ， 人 们 通 
过 发 现 许 多 可 行 解 不 能 成 为 最 优 解 (optimal solution) 来 修剪 解 空 间 (solution space), 

现在 通过 图 5$-17 来 解释 分 支 限界 策略 的 基本 原理 。 








图 5-17 一 个 多 级 图 搜索 问题 


在 图 5-17 中 ， 问 题 是 找 出 从 W 到 翁 的 最 短路 径 。 这 个 问题 能 先 通过 转换 成 一 棵 树 搜索 问题 
而 有 效 地 解决 ， 如 图 5-18 所 示 。 

图 5-18 显 示 了 所 有 6 个 可 行 解 。 如 果 不 使 用 穷 举 搜索 ， 那 么 分 支 限界 策略 是 如 何 帮助 我 们 找 
到 最 短路 径 的 呢 ? 图 5-19 说 明了 使 用 某 种 门 山 法 的 过 程 。 在 图 5-19a 中 ， 搜 索 树 的 根 结 点 扩展 出 来 
的 3 个 结 点 。 在 这 3 个 结 点 中 ， 必 须 选择 一 个 结 点 来 扩展 。 有 许多 方法 选择 下 一 步 要 扩展 的 结 点 。 
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图 5-18 图 5-17 中 间 题 解 的 树 表示 

在 这 个 例子 中 ， 假 定 使 用 息 山 法 ， 也 就 是 在 所 有 最 近 扩 展 的 结 点 中 ， 总 是 选择 最 少 代价 的 
结 点 作为 下 一 个 扩展 的 对 象 。 

使 用 这 个 原理 ， 结 点 b 将 被 扩展 ， 它 的 两 个 孩子 如 图 5-19b 所 示 。 由 于 结 点 f 对 应 于 V, ;， 并 
且 在 结 点 e 和 /中 ， 它 的 代价 最 少 ， 所 以 了 将 被 扩展 。 因 为 结 点 g 是 一 个 目标 结 点 ， 如 图 5-19c 所 
示 ， 我 们 已 经 发 现 一 个 可 行 解 ， 这 个 可 行 解 的 代价 是 5。 

这 个 代价 等 于 5 的 可 行 解 可 作为 最 优 解 的 上 界 。 任何 代 价 大 于 5 的 解 都 不 能 成 为 一 个 最 优 解 。 
因此 ， 这 个 上 界 能 终止 许多 不 成 熟 的 分 支 。 例 如 ， 结 点 e 将 决 不 会 产生 任何 最 优 解 ， 由 于 具有 
结 点 e 的 解 代价 肯定 超过 6。 





找 出 一 个 代价 等 于 5 的 吉 行 解 


c) d) 
图 5-19 分 支 限界 策略 的 举例 


如 图 5-19 所 示 ， 穷 举 搜索 整个 解 空间 是 可 以 避免 的 。 当 然 ， 必 须 指 出 还 有 另 一 个 最 优 解 存在 。 
上 面 的 例子 说 明了 分 支 限界 策略 的 基本 原理 。 这 个 策略 由 两 个 重要 机 制 组 成 : 一 个 机 制 是 
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产生 分 支 ， 另 一 个 机 制 是 产生 一 个 界限 以 致 于 能 终止 许多 分 支 。 尽 管 分 支 限界 策略 通常 是 非常 
有 效 的 ， 但 在 最 坏 情 况 下 ， 仍 然 可 能 生成 一 棵 规模 非常 大 的 树 。 因 此 ， 我 们 必须 认识 到 分 支 限 
界 策 略 在 平均 情况 下 是 有 效 的 。 


5.6 用 分 支 限界 策略 解决 人 员 分 配 问 题 


现在 介绍 如 何 使 用 分 支 限 界 策略 有 效 解决 人 员 分 配 问题 (personnel assignment problem) , 
这 个 问题 是 NP 完全 的 。 有 一 个 人 员 线 序 集 (linearly ordered set) P= {P,, Pa, ©, Pa), HP 
Pi<P<…<P,。 可 以 设想 这 个 人 员 顺 序 是 通过 某 个 标准 确定 的 ， 例 如 身高 、 年 龄 、 资 历 等 。 还 
有 一 个 工作 集 y HL, Joy oo, St, FP ABE LE TEE a PAY (partially ordered) 。 每 个 人 分 
配 一 项 工作 。 令 Pj 和 P, 各 自分 配 的 工作 分 别 是 f (P) 和 f (P)。 如 果 f (P) <f (P)， 那 么 Pi<P)。 函 
数 F 以 解释 为 一 个 可 行 的 分 配 ， 该 分 配 映 射 人 到 适合 他 们 的 工作 。 如 果 i 震 j， 那 么 f (P) 去 f (P)。 

考虑 下 面 的 例子 。 P={P,, Py, P3}, J={J, J, J}, 并 且 J/ 的 偏 序 是 J 所 J 和 J, 拟 J。 在 这 
种 情况 下 ， Pid, P, JAP; J AE YTD AC, 而 已 一 由， P, 一 J 和 P; 一 外 是 不 可 行 的 分 配 。 

进一步 假设 将 已 分 配 了 工作 J 的 代价 表示 为 Cj。 如 果 P; DHT, MASX MAL, GMA 
0。 那 么 与 可 行 性 分 配 相 应 的 总 代价 /为 

SGX; 


对 人 员 分 配 问题 精确 的 定义 如 下 : 已 知 一 个 人 员 线 序 集 P = {P,, Pro, os Pad, HIP 
Pi<P,<*…<P,, 以 及 一 个 工作 偏 序 集 J = {J Jo, es Ia} 某 人 已 分 配 到 工作 /的 代价 为 Ci 
每 个 人 分 配 一 项 工作 且 没 有 两 个 人 分 配 同 样 的 工作 。 人 员 分 配 问题 是 要 找到 一 种 最 优 的 可 行 分 
配 ， 使 得 下 面 的 代价 最 小 

XOX; 


这 样 ， 该 问题 是 一 个 优化 问题 ， 并 且 已 被 证 明 是 NP 难 的 。 此 处 不 讨论 NP 困 难 性 。 

为 了 解决 该 问题 , 将 使 用 “拓扑 排序 ”(topological sorting). 1 
的 概念 。 对 于 一 个 已 知 的 偏 序 集 9， 当 在 这 个 偏 序 中 ，Si< Siz | 
示 在 此 序列 中 5 位 于 5 之前， 那么 线 序 S,，5,，…，5, 是 关于 集 ! 
合 8 拓 扑 有 序 的 。 例 如 ， 对 于 如 图 5-20 所 示 的 偏 序 ， 其 相应 的 | 
G4) FEAE, 3, 7, 4, 9, 2, 5, 8, 6, 

P, >Ja Pod os P, >J ATH ae. 根据 问题 7 
定义 ,工作 是 偏 序 的 而 人 员 是 线 序 的 。 因 此 ， 相 对 于 工作 的 仿 | 
E, Jas Ja ty Jo EEG SAA, AtA i 
RABA, BB = Uday Jy, SSFP = {Pi, Po, P3, Pad, | 
/的 偏 序 如 图 5-21 所 示 。 : 


2 


| 
一 





下 面 是 所 有 的 拓扑 有 序 序 列 : 

Jo Ise Too Js 图 5-20 一 个 偏 序 
Ji, Jos Ja J; J, J, 
Jo Js, Jy Ja | | 
J, Jie Jz, J, 

Jz, J, Ja, J; Jy J4 


每 个 序列 表示 一 个 可 行 的 分 配 。 例 如 ， 对 于 第 一 个 序列 ， 图 5-21 工作 的 一 个 偏 序 
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对 应 的 可 行 分 配 是 
Pi hh, Py dy, Py ds, Pads 


树 搜索 技术 能 容易 地 用 于 找 出 所 有 的 拓扑 有 序 序列 。 例 如 ， 对 于 图 5-21 中 所 示 的 偏 序 序列 ， 
显示 其 所 有 的 拓扑 有 序 序列 的 树 如 图 5-22 所 示 。 





图 5-22 对 应 于 图 $-21 的 所 有 拓扑 有 序 序列 的 树 表示 


图 5-22 中 的 树 通过 下 面 三 个 基本 步骤 产生 。 

(1) 取 一 个 元 素 ， 在 这 个 偏 序 序列 中 它 都 不 先 于 任何 其 他 元 素 。 

(2) 选择 此 元 素 作为 拓扑 有 序 序 列 中 的 一 个 元 素 。 

(3) 把 这 个 刚 选择 的 元 素 从 偏 序 集中 删除 ， 剩 余 的 集合 仍然 是 偏 序 的 。 

例如 ， 对 于 图 5-21 中 所 示 的 偏 序 。 在 开始 时 ， 厂 和 j/ 是 没有 前 驱 的 元 素 。 因 此 ， 它 们 在 树 
的 同一 层 上 。 考 虑 相应 于 1 的 结 点 ， 如 果 删 除 !， 那 么 偏 序 集 包含 2、3 和 4。 在 新 的 集合 中 只 有 2 
和 3 没有 前 驱 。 因 此 ， 生 成 2 和 3。 

在 前 述 了 如 何 用 一 棵 树 描述 问题 的 解 空 间 之 后 。 现 在 ， 继 续 阐述 如 何 使 用 分 支 限界 策 略 找 
到 最 优 解 。 . 

LTRS, RESEDA TP RH k ERER, T 
影响 解 并 且 在 每 行 每 列 至 少 有 一 个 0， 以 及 代价 矩阵 中 所 有 其 他 项 的 值 非 负 。 

注意 到 ， 如 果 从 这 个 代价 矩阵 的 任何 行 或 列 中 减 去 一 个 常数 ， 不 会 改变 最 优 解 ， 参 见 
表 5-1 所 示 的 代价 矩阵 。 对 于 该 数据 集 ， 可 从 1、2、3 和 4 行 分 别 减 去 12、26、3 和 10， 再 从 
第 2 列 减 去 3， 所 得 到 的 矩阵 是 一 个 简化 的 代价 矩阵 ， 每 行 每 列 至少 包 含 一 个 0 并 且 怎 阵 中 其 
他 的 值 非 负 ， 如 表 5-2 所 示 。 被 减 去 的 值 的 总 和 为 12 + 26 + 3 + 10 + 3 = 54， 这 是 解 的 一 个 
下 界 。 


表 5-1 人 员 分 配 问题 的 代价 矩阵 - 
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表 5-2 简化 的 代价 矩阵 








图 $-23 表 示 一 棵 与 该 简化 代价 矩阵 相关 联 的 枚 举 树 (enumeration tree) 。 如 果 使 用 最 小 下 
界 ， 那 么 不 能 产生 最 优 解 的 子 解 将 会 在 更 早 的 阶段 被 修剪 掉 ， 如 图 $-24 所 示 。 


分 配 的 人 员 





图 5-23 与 表 5-2 中 简化 代价 和 矩阵 相关 联 的 枚 举 树 


在 图 5-24 中 看 到 在 找 出 代价 为 70 的 解 后 ， 可 以 立即 剪 去 已 经 给 已 分 配 由 开始 的 所 有 解 ， 因 
为 其 代价 71 比 70 大 。 分 配 的 人 员 

为 什么 可 以 从 代价 矩阵 中 减 去 一 些 值 
WE? 假如 不 这 么 做 ， 那 么 考虑 对 应 于 分 配 
Pi 一 J 的 结 点 。 与 这 个 结 点 相关 的 代价 仅 是 
29, 想像 我 们 已 经 找 出 了 代价 为 70 的 可 行 解 ， 
也 就 是 P 一 也， P,>J,, P;— J ANP, J; 尽 
管 已 经 找到 一 个 上 界 ， 但 不 能 使 用 它 前 去 对 
应 于 已 一刀 的 结 点 ， 因 为 它 的 代价 仅 是 29 ， 70 
比 70 低 。 

再 看 图 $-24。 现 在 能 看 到 给 已 分配 由 相 
关 的 代价 是 71， 而 不 是 29。 这 样 产生 了 一 个 
界限 。 为 什么 能 有 这 样 高 的 代价 呢 ? 因为 我 
们 已 经 从 初始 的 代价 矩阵 中 减 去 了 一 些 值 ， 图 5-24 子 解 的 界 
使 每 行 每 列 都 包含 一 个 0。 这 样 ， 在 减 去 后 ， 所 有 的 解 有 相对 比较 高 的 下 界 ， 即 34。 换 名 话说 ， 
没有 代价 能 比 54 低 。 使 用 这 个 信息 我 们 知道 ， 给 书 分 配 ] 的 下 限 是 54 + 17 = 71， 而 不 是 29。 当 
然 ， 一 个 相对 比较 高 的 下 限 会 导致 相对 较 早 地 终止 。 


5.7 用 分 支 限 界 策略 解决 旅行 商 优化 问题 


旅行 商 决 策 问题 (traveling salesperson decision problem) 是 一 个 NP 完 全 问题 。 因 此 ， 在 
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最 坏 情况 下 旅行 商 问题 (traveling salesperson problem) 是 很 难 解决 的 。 但 是 ， 如 将 在 本 节 中 
所 介绍 的 ， 旅 行商 问题 可 通过 使 用 分 支 限 界 策略 来 解决 。 也 就 是 说 ， 假 如 是 够 幸运 ， 可 以 避免 
对 解 空间 进行 穷 举 搜索 。 

使 用 分 支 限界 策略 解决 旅行 商 优化 问题 的 基本 原理 由 两 部 分 组 成 。 

(1) 用 -一 种 方法 划分 解 空间 。 

(2) 对 一 类 解 用 一 种 方法 预测 下 界 ， 用 另 一 种 方法 找到 最 优 解 的 上 界 。 如 果 一 个 解 的 下 界 
超过 了 上 界 ， 那 么 这 个 解 不 是 最 优 解 ， 所 以 ， 应 该 终止 与 这 个 解 相关 的 分 支 。 

旅行 商 问 题 可 以 定义 在 图 或 平面 的 点 上 。 如 果 将 其 定义 在 平面 的 点 集 上 ， 那 么 可 以 使 用 许 
多 方法 使 算法 更 有 效 。 在 本 节 中 ， 假 设 问题 定义 在 图 上 。 为 了 简化 讨论 ， 假 定 在 顶点 与 其 本 身 
之 间 没 有 弧 ， 并 且 在 每 对 顶点 之 间 有 代价 为 非 负 的 弧 。 旅 行商 问题 是 要 找 出 一 条 代价 最 小 的 回 
路 ， 它 从 任意 -个 顶点 开始 ， 经 过 每 一 个 顶点 ， 再 返回 出 发 顶点 。 

车 虐 表 5-3 所 示 的 代价 矩阵 。 


表 5-3 一 个 旅行 商 问题 的 代价 矩阵 











6 3 88 18 46 92 æ 7 
7 44 26 33 27 84 39 oo 


使 用 分 支 限 界 策略 将 解 分 成 两 组 ,一 组 包括 某 条 特定 的 弧 ， 另 一 组 不 包括 该 弧 。 每 次 划分 
产生 一 个 下 界 ， 利 用 “更 低 ” 的 下 界 来 遍历 搜索 树 。 

首先 ， 如 前 所 述 ， 如 果 从 这 个 代价 和 矩阵 的 任 一 行 或 列 中 减 去 一 个 常数 ， 不 会 改变 最 优 解 。 
从 表 5-3 为 例 ， 从 和 矩阵 中 减 去 每 一 行 的 最 小 代价 ， 那 么 减 去 的 总 数 将 会 是 旅行 商 问 题解 的 下 界 。 
因此 ， 我 们 可 从 1~7 行 中 分 别 减 去 3，4，16，7，25，3 和 26， 总 共 减 去 的 代价 为 3 + 4+ 16+7 
+25+3+26=84。 通 过 这 个 方法 ， 可 以 得 到 简化 的 代价 矩阵 ， 如 表 5-4 所 示 。 


表 5-4 CRIA 








: l 2 3 4 5 6 7 
| 0 90 10 30 6 54 
2 0 2 73 38 17 12 30 
3 29 1 a 20 0 12 9 
4 32 83 73 æ% 49 0 84 
5 3 21 63 8 oo 0 32 
6 0 85 15 43 89 oo 4 
7 | B 0 7 1 58 13 s 
FERS-AR AM, EAE, Ri, EA, B3, 4TA RTU ER., 


因此 ， 可 再 从 3，4 和 7 列 中 分 别 减 去 ?，1 和 4。( 总 的 减 去 代价 为 7 + 1 + 4 = 12。) 最 终 得 到 的 简 
化 矩阵 如 表 5-5 所 示 。 
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表 5-5 另 一 个 简化 的 代价 矩阵 








由 于 减 去 的 总 代价 为 84 + 12 = 96， 我 们 便 知 道 这 个 旅行 商 问 题 的 下 界 为 96。 

接 下 来 考虑 下 面 的 问题 ， 假设 知道 一 条 回路 包括 弧 4-6， 其 代价 是 零 。 那 么 ， 这 条 旅行 线 
路 的 代价 下 界 是 多 少 呢 ? 答案 很 简单 : 下 界 仍 是 96。 

假设 知道 回路 不 包括 绝 4-6， 那 么 新 的 下 界 又 会 是 多 少 呢 ? 查看 表 5-5， 如 果 一 条 回路 不 包 
括 4-6， 那 么 肯定 包括 一 条 从 4 出 发 的 其 他 弧 。 
从 4 出 发 的 最 小 代价 弧 是 4-1， 基 代价 是 32， 到 
终点 是 6 的 最 小 代价 弧 是 5-6， 其 代价 是 零 。 
此 ， 新 的 下 界 为 96 + (32 + 0) = 128。 由 此 得 到 
的 二 叉 树 如 图 5-25 所 示 。 





为 什么 选择 弧 4-6 来 做 划分 ? 因为 弧 4-6 能 下 界 = 96 下 界 = 96 + 32 = 128 
SETARA. AB RO FSA 3-5 HR AR , ; Na 
那样 的 话 ， 下 界 仅 增加 了 1+ 17 = 18。 图 5-25 决策 树 的 最 高 层 


现在 考虑 左 子 树 。 在 这 桔 子 树 中 包含 弧 4-6。 所 以 ， 必 须 从 代价 阵 中 删除 第 四 行 和 第 六 列 。 
而 且 ， 由 于 包含 了 弧 4-6， 所 以 弧 6-4 就 不 能 再 包含 了 ， 必 须 置 Cs 为， 这 样 得 到 的 新 矩阵 如 表 
5-6 所 示 。 
表 5-6 不 包含 弧 4-6 的 简化 代价 阵 











再 次 注意 到 ， 现 在 第 5 行 仍然 不 包含 零 ， 所 以 ， 可 以 对 第 5 行 减 去 3， 相 对 于 左 子 树 的 简化 
代价 阵 如 表 5-7 所 示 ， 同 样 必 须 将 左 子 树 的 下 界 也 增加 3 (具有 弧 4-6 的 解 )。 


表 5-7 相对 于 表 5-6 的 简化 代价 矩阵 
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AE ERNE, BRAM, REECH, ALETA, ERR 
如 图 5-26 所 示 。 如 果 沿 着 最 小 代价 的 路 径 ， 将 会 得 到 代价 为 126 的 可 行 性 解 。 将 这 个 代价 126 作 
为 上 界 ， 许 多 分 支 可 以 终止 ， 因 为 这 些 分 支 的 下 界 超过 此 界 。 


具有 弧 3-5 | 下 界 = 99 


F 界 = 96 


[Kaaso] 下 界 = 128 


终止 结 点 












下 办 = 117 将 扩展 结 点 
具有 弧 2-1 下 界 = 125 将 扩展 结 点 


PR = 153 将 扩展 结 点 





AAM67 | 下 界 = 126 BAA M 6-7) 下 界 = 141 将 扩展 结 点 


AAMS-2 | 下 不 具有 弧 5-2| 无 解 











具有 弧 7-3 不 具有 弧 7-3| 无 解 


图 5-26 旅行 商 问题 的 分 支 限界 解 
还 有 一 点 需要 提 一 下 。 考 虑 所 有 包含 弧 4-6，3-5 和 2-1 的 简化 代价 矩阵 如 表 5-8 所 示 。 
表 5-8 简化 的 代价 矩阵 








可 以 用 弧 1-4 来 划分 ， 得 到 的 子 树 如 表 5-9 所 示 。 
表 5-9 简化 的 代价 矩阵 











注意 ， 已 经 确定 将 弧 4-6 和 2-1 包 含 在 解 中 。 再 加 一 条 弧 1-4， 很 显然 ， 必 须 避 免 使 用 弧 6-2。 
如 果 使 用 弧 6-2， 就 会 出 现 一 条 回路 ， 这 是 不 允许 的 。 所 以 必须 设置 C。 为"。 从 而 ， 将 会 得 到 


左 子 树 的 代价 矩阵 如 表 5-10 所 示 。 
“Z, MREZE Ri i o in Mih HLR RMR E, MA 
不 允许 有 从 j, 到 i 的 路 径 。 
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表 5-10 简化 的 代价 和 矩阵 


i 2 3 7 
5 14 oo 21 
6 90 8 0 
7 0 0 2 





5.8 用 分 支 限界 策略 解决 0/1 背 包 问 题 


0/1 背 包 问 题 (0/1 knapsack problem) 定义 如 下 : 已 知 正 整数 P， P,, wee Pno W,, 
W, ©, WAIM, HX, Xs es X,, X=0381, i=1, 2, =, n, WERE 
5 Wx, <M 
i=l 
使 得 


DPX 
最 大 。 


该 问题 是 一 个 NP 难 问题 。 然 而 ， 正 如 后 面 将 看 到 的 ， 我 们 仍然 可 用 分 支 限 界 策略 解决 该 
问题 。 当 然 ， 在 最 坏 情 况 下 ， 就 算是 分 支 限 界 策略 能 解决 此 问题 也 需要 花费 指数 级 步 数 。 

最 初 的 0/1 背包 问题 是 求 最 大 值 问题 ， 不 能 使 用 分 支 限 界 策略 解决 。 为 了 解决 /1 背包 问题 ， 
必须 将 最 初 的 0/1 背 包 问 题 修改 成 如 下 的 求 最 小 值 问题 : CAER, Pas es Pas Wis 
W,, ©, WAM, HRX, Xos oes X,, X;=0 或 1, i=1, 2, …, n。 满足 下 面 的 条 件 


3, WX, <M 


-Sx 
最 小 。 


任何 分 支 限界 策略 都 需要 一 个 分 支 机 制 。 在 0/1 背 包 问 题 中 ， 该 分 支 机 制 如 图 5-27 所 示 。 第 
一 个 分 支 将 所 有 的 解 划 分 成 两 组 ,一 组 是 X, = 0 的 解 ， 另 一 组 是 X = 1 的 解 。 对 于 每 一 组 ， 继 续 
用 ,来 划分 。 正 如 所 看 到 的 ， 当 列举 完 n 个 X 之 后 ， 就 可 以 找到 可 行 解 了 。 





图 5-27 在 分 支 限界 策略 解决 0/1 背 包 问 题 中 的 分 支 机 制 
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TE PRE ZRA RS ARRON BDA, BML PF Ee EZ RR eT a, 4 
分 支 限 界 策略 解决 旅行 商 问题 的 上 时候， 使 用 了 下 面 的 基本 原则 ， 将 解 划分 成 两 组 ， 对 于 每 一 组 
找 出 - -个 下 界 。 同 时 ， 尝 试 找到 一 个 可 行 解 。 一 旦 发 现 可 行 解 ， 都 会 找到 一 个 上 界 。 当 上 生 仅 当 
满足 以 下 条 件 之 一， 分 支 限界 策 略 就 会 终止 … 个 结 点 的 扩展 

(1) 这 个 结 点 本 身 表示 了 一 -个 不 可 行 解 ， 那 么 没有 再 扩展 的 意义 了 。 

(2) 这 个 结 点 的 下 界 大 于 或 等 于 当前 找 出 的 最 小 上 界 。 

现在 对 分 支 限界 策略 解决 0/1 背 包 问 题 做 进一步 改进 。 仍 然 将 解 划分 成 两 组 。 对 于 每 一 组 ， 
通过 找 出 一 个 可 行 解 ， 不 仅 找 出 一 个 下 界 ， 而且 还 找 出 一 个 上 界 。 当 扩展 一 个 结 点 的 时 候 ， 希 
望 用 较 小 的 代价 找到 一 个 解 。 这 意味 着 当 扩展 一 个 结 点 时 ， 和 希望 找 出 一 个 较 小 上 界 。 如 果 知 道 
找 出 的 这 个 上 界 不 能 再 小 了 时 (已 等 于 其 下 界 ) ， 就 不 再 需要 扩展 这 个 结 点 。 总 之 ， 当 且 仅 当 
一 个 结 点 满足 了 以 下 条 件 之 -- 时 ， 就 可 以 终止 扩展 了 : 

(1) 这 个 结 点 本 身 表 示 一 个 不 可 行 解 。 

(2) 这 个 结 点 的 下 界 大 于 或 等 于 当前 找 出 的 最 小 上 界 。 

(3) 这 个 结 点 的 下 界 等 于 上 界 。 

如 何 找 出 一 个 结 点 的 上 界 和 下 界 昵 ?下 界 可 以 认为 是 所 能 得 到 的 最 优 解 的 值 。 树 中 的 一 个 
节点 对 应 于 构造 的 部 分 解 ， 因 此 ， 该 结 点 的 下 界 对 应 于 此 部 分 构造 解 相 关 可 能 的 最 高 利益 。 因 
为 一 个 结 点 的 上 界 意味 着 可 行 解 的 代价 与 这 个 部 分 构造 解 相对 应 。 下 面 通过 一 个 例子 来 说 明 我 
们 的 方法 。 


考虑 以 下 的 数据 : 
i 1 2 3 4 5 6 
P, 6 10 4 5 6 4 


= 
— 
5 
© 
oo 
5 
— 
N 


M = 34 
应 当 注 意 到 ，P;/W, 之 Pi, i/W,1， 其 中 i= 1，2，…，5。 后 面 将 会 看 到 这 个 顺序 是 必要 的 。 
如 何 找 到 可 行 解 
从 最 小 可 用 的 开始 向 最 大 的 扫描， 直到 超过 M， 可 行 解 很 容易 找 出 。 例 如 ， 可 以 令 Xl =X 


=1， 那 么 2 WX, = 10+19=29<M=34, 这 意味 着 X =X, = 1 是 可 行 解 。( 注 意 ， 不 能 进一步 
3 
$X, =l, 因为 WX >34.) 


如 何 找到 下 界 

为 了 找到 下 界 ， 回 忆 下 界 对 应 于 所 取得 代价 函数 的 最 佳 值 。0/1 背 包 问 题 是 一 个 受 约束 的 
优化 问题 ， 因 为 X; 限制 为 是 0 和 1。 

如 果 放 宽 这 个 约束 条 件 ， 将 得 到 较 好 的 结果 ， 将 该 结果 用 作 下 界 。 可 以 令 X; 为 0 到 1 之 间 的 
数 。 如 果 这 样 做 ， 那 么 0/1 背 包间 题 变 成 定义 如 下 的 背包 问题 : 已 知 正 整数 Pi，P;，…，P,，Wi， 
Wy，…，W, 和 M， 找 到 X1，X,，…，X，0<X<1, i= 1，2，…，n。 在 满足 下 面 的 条 件 时 


2 WX, <M 


使 得 
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n 
~ PX, 
i=l 


最 小 。 


& -$ PX 是 0 背包 问题 的 最 优 解 ， 而 -Y RX! 是 青 包 问题 的 最 优 解 ， 令 Y= -Ù EX, 


Y= -XBX 。 容 易 证 明 } <Y。 也 就 是 说 一 个 背包 问题 的 解 可 作为 一 个 0/! 青 包 问题 解 的 下 界 。 


关于 背包 优化 问题 ， 有 趣 的 :点 是 贪心 算法 可 以 找到 背包 问题 的 最 优 解 (见习 题 3.11)。 
考虑 上 面 提供 的 数据 ， 假 设 已 经 罚 X = X,=1, RARER SX, AL, AAW, +W, + Ws 会 超过 M。 
然而 ， 如 果 置 X; 值 在 0 与 1 之 间 ， 那 么 将 得 到 背包 问题 的 一 个 最 优 解 ， 这 个 解 是 0/1 背包 问题 的 
最 优 解 的 下 界 。X; 的 近似 值 如 下 得 到 ， 由 于 M = 34， 且 Wi + Ws = 10 + 19 = 29， 那 么 X; 的 最 佳 
值 应 该 是 Wi + W, + WX, = 10 + 19 + 8X, = 34， 即 X = (34 一 29)/8 = 5/8。 使 用 这 个 值 ， 可 以 得 到 
下 界 为 -(6 + 10 + 5/8 x 4) = -18.5。 我 们 使 用 较 高 的 界限 ， 因 此 下 界 为 -18。 

我 们 考虑 X， = 1, X,= 0#0X, = 0 的 情况 。 HFW, + Wa + W; = 32<34 H.W, +W,+ Ws + Wo = 
40>34， 那 么 ， 通 过 解 以 下 方程 得 到 下 界 

W, + W, + W; + W,X, = 32 + 8X, = 34 
可 以 得 到 : WX, = 34-32 =2, 并 且 


X= Eede BARE Pe PR 


_{ 1p\_ _f laa 
(A +h Bea key = (OF 5 +647 x4) = 一 18 
注意 ， 我 们 找 下 界 的 方法 是 正确 的 ， 因 为 P/W, 之 P;, UVW， 且 贪心 算法 能 在 此 情况 下 正确 
地 找到 背包 (而 非 0/1 A) 问题 的 最 优 解 。 
如 何 找 到 上 界 
考虑 以 下 情况 : 
X,=1, X,=0, X;=0, X=0 
上 界 对 应 于 
X,=1, X,=0, X,=0, X=0, X=1, X=1 
该 上 界 是 -(P, + P; + Pa) = (6 +644) = 一 16。 这 意味 着 到 目前 为 止 ， 我 们 关注 这 个 结 点 ， 
如 果 进 一 步 扩展 该 结 点 ， 将 会 得 到 一 个 代价 为 ~16 的 可 行 解 。 这 就 是 说 -16 是 这 个 结 点 上 界 的 
原因 。 
整个 问题 的 解决 可 以 用 如 图 $-28 所 示 的 一 棵 树 说 明 。 每 个 结 点 上 的 数字 表示 扩展 的 顺序 。 
采用 最 佳 搜索 规则 ， 也 就 是 说 ， 用 最 好 的 下 界 扩展 结 点 。 如 果 两 个 结 点 有 相同 的 下 界 ， 那 么 扩 
展 具 有 较 小 上 界 的 结 点 。 
在 图 5-28 所 示 的 树 中 ， 
(1) 结 点 2 终止 是 由 于 它 的 下 界 等 于 结 点 14 的 上 界 。 
(2) 所 有 其 他 结 点 终止 是 由 于 局 部 的 下 界 等 于 局 部 的 上 界 。 
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PIF 
上 办 = 一 16 
下 界 = 一 18 
X=1 x,=0 
k #=-16 上 办 = 一 14 
下 办 = 一 18 2 | eRe 
X =I x,=0 
上 办 = 一 16 上 界 = 一 15 
3 | [办 =--18 4 | cmos 在 这 里 找 出 好 
WEF 
X51 X=0 x=! x,=0 
ave |- 界 =-16 上 办 =-15 | 上 界 =-17 
X,=! x,=0 X =! X,=0 X,=1 X=0 
Kafi 上 界 =~16 上 界 = 一 15 be 16 R= 17 
上 界 =-16 
下 界 =-16 
X= 0 X= 0 X= 0 X= 0 
Hs 16 芋 界 = 一 1S 上 办 = 一 16 ae tie 
“(J io] tear] se [an teense eft ey 
上 界 =-15 
e's 
X,= 0 X= 1 X= 0 X= I X= 0 
上 办- -15 上 内- -16 
[it ene pojela ess Bo] ii] [Bs] Rio] oH 
上 和 界 = 一 17 
下 界 = 一 17 


图 5-28 用 分 支 限 界 策略 解决 0/1 背 包 问 题 


5.9 用 分 支 限 界 方法 解决 作业 调度 问题 


虽然 很 容易 解释 清楚 分 支 限 界 策略 的 基本 原则 ， 但 是 并 不 意味 着 就 能 很 有 效 地 使 用 这 个 策 


略 。 需 要 设计 好 的 分 支 与 限界 规则 。 在 本 节 中 ， 将 会 看 到 拥有 聪明 限界 规则 的 重要 性 。 


scheduling problem) : 
业 可 在 任 一 台 处 理 器 上 执行 


作业 存在 ， 但 是 还 没有 执行 ， 那 么 这 项 作业 
也 不 能 执行 。 


PORE NLM, BARAER DAJ 
始 执行 这 项 作业 。 


根据 以 下 假设 的 作业 调度 问题 (job 
(1) 所 有 的 处 理 器 都 是 一 样 的 ， 任 何 作 


(2) 有 一 个 作业 的 偏 序 集 。 如 果 前 一 项 


G) 只 要 一 台 处 理 器 处 于 空闲 状态 





(4) 每 一 项 作业 所 执行 的 时 间 相 同 。 
(5) 给 定 一 个 时 间 表 ， 详 细 说 明 在 每 一 


段 时 隙 内 辣 时 使 用 的 处 理 器 数量 。 图 5-29 一 个 作业 调度 问题 的 偏 序 
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调度 的 目标 是 最 小 化 最 大 完成 时 间 ， 这 个 值 是 完成 最 后 一 项 作业 的 时 间 段 。 

在 图 5-29 中 ， 已 知 一 个 偏 序 集 。 正 如 所 看 到 的 ， 作 业 / 必 须 等 待 作 业 C 和 D， 作 业 H 等 待 作 
WB, HO, AAT PARES IZ BIT 

现在 考虑 如 表 5-11 所 示 的 时 间 表 。 


表 5-11 一 个 时 间 表 
T, T, T; Tı T; Te T, T, To 
3 2 2 2 4 5 3 2 3 





这 个 时 间 表 说 明 在 ! = 1 时 刻 ， 仅 有 3 台 处 理 器 可 以 使 用 ， 在 + = 5 时 刻 ，4 台 处 理 器 处 于 活动 
状态 。 
根据 图 5-29 的 偏 序 和 上 述 的 时 间 表 ， 可 以 得 到 两 个 可 能 的 方案 : 


Wel: T, T, T; T, Ts Te 
A B C H M J 
* D I L E K Time = 6 
* F N 
P O 
G 
， 解 2: Ti T, T, T, T; Ts T; T; 
B D F H L M N Time =8 
* C E G I J K 0 
x P * * 
* * 
* 


显然 ， 解 1 好 于 解 2。 作 业 调 度 定义 如 下 : 已 知 一 个 偏 序 图 和 --- 个 时 间 表 ， 找 到 完成 所 有 作 
业 具 有 最 小 时 间 步 数 的 解 。 这 个 问题 称 为 具有 优先 约束 (precedence constraint) 和 时 间 表 的 等 
执行 时 间作 业 调 度 问 题 (equal execution-time job scheduling problem)， 它 已 被 证 明 是 一 个 NP 
难 问题 。 

首先 将 通过 树 搜索 技术 解决 该 作业 调度 问题 。 假 如 作业 偏 序 如 图 $-29 所 示 ， 时 间 表 如 表 5-11 
所 示 。 那 么 ， 部 分 解 树 如 图 $-30 所 示 。 

这 棵 树 的 树 顶 是 个 空 结 点 。 从 时 间 表 中 可 以 看 出 能 够 执行 作业 的 最 大 数量 是 3。 由 于 作业 4 
是 唯一 的 可 在 起 始 执行 的 作业 ， 那 么 解 树 的 第 一 层 仅 由 一 个 结 点 构成 。 在 4 执行 完 后 ， 从 时 间 
表 中 可 以 看 出 ， 有 两 项 工作 现在 可 以 执行 ， 在 图 5-30 中 解 树 的 第 二 层 显 示 了 所 有 可 能 的 组 合 。 
由 于 空间 所 限 ， 我 们 仅 将 结 点 的 后 代 作为 解 树 结 点 的 子 集 。 

在 上 面 的 图 中 ， 看 到 如 何 通过 树 搜索 技术 来 解决 具有 时 间 表 的 作业 调度 问题 。 在 下 面 几 节 
中 ， 将 会 看 到 为 了 使 用 分 支 限界 策略 ， 需 要 设计 出 好 的 分 支 与 限界 规则 ， 以 便 能 够 避免 搜索 整 
棵 解 树 。 

以 下 四 条 规则 是 分 支 限 界 方法 所 采用 的 ， 这 里 不 证 明 这 些 规 则 的 有 效 性 ， 仅 对 它们 做 非 正 
式 地 描述 。 
规则 1， 共 同 后 继 效应 

这 个 规则 可 再 次 对 图 5-30 做 非 正 式 的 解释 。 在 此 情况 下 ， 解 树 的 根 是 只 有 一 项 作业 构成 的 
结 点 4。 该 结 点 将 有 很 多 直接 的 子孙 结 点 ， 基 中 的 两 个 是 (C，ED 和 (D，P)。 如 图 5-29 所 示 ， 作 
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业 C 和 DP 共有 辣 一 个 子孙 1。 类 似 地 ，E 和 P 也 有 辣 -- 个 子孙 /。 在 这 种 情况 下 ， 规 则 1 保证 了 仅 有 
个 结 点 ， 要 么 是 (C， 百 要 么 是 (D，P) 需 要 在 解 树 中 扩展 。 因 为 任何 一 个 由 结 点 (C， 司 开头 的 
最 优 解 的 长 度 都 与 从 结 点 (D，P) 开 头 的 一 样 。 


O Ho 





(*, A, *} El 

















(B.C) (B.D) (B.E) (B.P) (C, D) (C.E) (C, P) (D.E) (D, P) (E, P) E2 
(E, P) (ULP) (LE) (BE) (B.P) (B.D 一 R 

_ 一 二 一 , 
(FG) (FA) (ED (F.P) (GH) (G.D (GP) (HD (H.P) (LP) 层 4 
(F. H.L. P) iss 

(KM. J. *, *) 6 

(N. 0, *) 层 7 





图 5-30 部 分 解 树 
* 表示 一 台 空 闲 处 理 器 
为 什么 能 做 出 这 个 结论 妮 ? 考 虑 一 个 从 (C，E) 出 发 的 可 行 解 ， 在 共处 有 作业 DP 和 P。 由 于 C 
和 D 有 同样 的 子孙 1， 那 么 可 以 在 不 改变 解 可 行 性 的 前 提 下 交换 C 和 D， 依 据 类 似 的 理由 ， 也 可 
以 交换 P 和 E。 因 此 ， 以 (CC，E) 开 头 的 可 行 解 可 以 转换 成 以 4D，P) 为 头 的 可 行 解 ， 而 不 会 改变 
解 的 长 度 。 由 此 看 出 ， 规 则 1 是 有 效 的 。 
规则 2， 内 部 结 点 优先 策略 
作业 优先 图 的 内 部 结 点 将 会 比 叶 子 结 点 优先 处 理 。 
这 个 规则 可 以 图 5-29 的 作业 优先 图 和 表 5-12 中 的 时 间 表 来 做 非 正 式 地 解释 。 
表 5-12 一 个 时 间 表 








在 这 种 情况 下 ， 图 5-31 中 显示 了 解 树 的 一 部 分 。 在 扩展 解 树 中 的 结 点 (B8，E，P) 之 后 ， 得 
到 结 点 (B， 巨 ， 户 的 许多 直接 后 继 孩 子 ， 其 中 两 个 是 (C， 六 和 (FE， 刀 ， 如 图 5-31 所 示 。 l 

在 作业 优先 图 中 ， 由 于 作业 C 和 D 是 内 部 结 点 , 而 F 和 J/ 是 叶子 结 点 ,规则 2 表明 交换 结 点 (C， 
D) 和 终端 结 点 (FF， 四 ， 类 似 于 用 于 解释 规则 1 时 的 理由 。 
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规则 2 表明 候选 集 应 该 划分 成 两 个 子 集 。 一 个 是 活动 的 内 部 结 点 ， 另 一 个 是 活动 的 叶子 结 
点 。 前 者 具有 处 理 的 较 高 优先 级 。 由 于 此 集合 的 规模 较 小 ， 可 以 减少 
可 能 选择 的 次 数 。 只 有 当 活 动 的 内 部 结 点 集合 小 于 活动 的 处 理 器 数量 
时 ， 要 选择 活动 的 叶子 结 点 集 。 由 于 叶子 结 点 没有 后 继 ， 如 何 选 择 它 
们 将 没有 差别 ， 可 以 选择 任 一 组 ， 如 图 5-30 所 示 ， 在 遍历 了 第 三 层 结 点 
(8，) 后 ， 在 当前 候选 集中 有 五 项 作业 (F，G，H，1，P)， 而 有 两 台 处 
理 器 处 于 活动 状态 ， 所 以 ， 可 以 产生 共 10 种 可 能 的 组 合 。 但 是 ， 如 果 JIN 
仅 考 虚 内 部 结 点 ， 那 么 只 产生 3 个 结 点 。 它 们 是 (H，D(H，P) 和 (1,，P)， (BD 
而 其 他 7 个 结 点 将 不 再 生成 。 
规则 3， 最 大 化 处 理 作业 的 数量 (EN) (C.D) 

在 从 时 段 1 到 时 段 ;的 部 分 或 完全 扩展 的 调度 S 中 ， 令 P(S，D 表 示 已 ”图 5-31 部 分 解 树 
经 处 理 的 作业 集 。 规 则 3 说 明 如 下 : 

对 另外 的 某 全 调度 8'， 如 果 P(S， 门 包含 在 P(8'，D 中 ， 那 么 ， 这 个 调度 $ 不 是 最 优 解 。 规 则 3 
显然 是 正确 的 。 如 图 5-32 所 示 ， 规 则 3 是 如 何 终止 解 树 中 的 一 些 结 点 。 对 于 图 5-32， 可 以 断言 
从 结 点 “***” 和 从 “**” 的 调度 不 比 从 “*” 开 始 得 好 。 这 是 由 于 P(5"，3) = PCS, 3), TPS, 
5) 包 含 在 P(S，5) 中 。 





调度 5 调度 5 
Ua BES" 调度 $ 
[ets 3) = (A, B, C, D, E) 
PIS, 3) = (A, B, C, D, E) 
P(S", 3) = P(S, 3) 
(pe. 5) = (A, B, C, D, E, F, G, H, I, P) 
P(S, 5) = (A, B, C, D, E, F, G, H, 1, P, L) 


F 
P(S'，5) 包 含 在 PS，5) 中 ) 


图 5-32 处 理 作 业 影 响 


规则 4， 累积 空闲 处 理 器 策略 


规则 4 说 明 如 下 : 
具有 比 可 行 调度 解 多 的 累积 空闲 处 理 器 数 的 部 分 调度 安排 不 会 比 此 可 行 解 好 ， 所 以 可 被 终止 。 








需 则 4 说 明 好 采 己 经 找到 了 可 行 解 ， 就 可 以 使 用 所 有 空闲 的 处 理 器 终止 解 树 的 其 他 结 点 。 
基 虑 多 5-33， 解 树 中 的 结 点 (KE，M， 刀 拥有 的 累积 空闲 处 理 器 数 是 4， 这 比 当前 可 行 解 的 处 
理 沉 数 还 要 多 。 所 以 ， 由 规则 4 可 知 结 点 (K，M，J，*，*) 可 被 限制 。 


~ 
aX XJ BEZNE RK = 2 


~\A N 
' 积 空闲 处 至 器 数 = 2 
CcXp) 杂 积 空闲 处 理 器 数 


(a Ye) REZAN = 2 
PALS AE lA ET = 
oO ANS ADEE aS Be = 2 
aa VTS ARAS 
积 室 | 内 处 理 器 =2 
TA nnsa 


TE ens 
累积 空闲 处 理 器 数 = 4 
Q AIA A A BRA ao R 


将 被 终 目 





















图 5-33 积累 的 空闲 处 理 器 效应 
5.10 A* 算 法 


4+ 算 法 (A* algorithm) 是 -… 种 很 好 的 树 搜 索 策 略 ， 很 受 人 工 智能 (artificial intelligence) 
研究 着 的 贮 欢 ， 但 非常 遗憾 的 是 它 经 常 被 算法 研究 者 所 忽视 。 

先 来 讨论 隐藏 在 4* 算 法 彰 后 的 哲学 ， 最 好 的 方法 是 把 它 与 分 支 限界 策略 进行 比较 。 注 意 ， 
企 分 支 限界 策 略 中 ,主要 的 工作 是 确定 不 必 进 一 步 考 查 许多 解 ， 因为 它们 不 会 最 终生 成 最 优 解 。 
因此， 在 分 支 限 界 策 略 中 主要 的 技巧 是 在 限界 。 

4*+ 算 法 强调 另 一 个 点 。 它 将 告诉 我 们 在 特定 情况 下 ， 已 得 到 的 一 个 可 行 解 肯定 是 一 个 最 优 
解 。 这 样 ， 我 们 可 以 停止 。 当 然 ， 我 们 希望 这 个 终止 出 现在 比较 早 的 阶段 。 

A* 算 法 通常 用 于 解决 优化 问题 。 它 使 用 最 佳 优 先 (最 少 代价 优先 ) 策略 (best-first (least- 
cost-first) strategy ) 。A* 算 法 关键 的 因素 是 代价 函数 (cost-function)， 参 见 图 5-34。 要 找到 从 5 
到 7 的 最 短路 径 ， 假 定 使 用 某 种 树 搜索 算法 来 解决 此 问题 。 解 树 的 第 一 步 显 示 在 图 5-35 中 。 结 
点 4 与 选择 V，( 边 a) 的 决策 有 关 。 通 过 选择 V1,， 当 前 的 代价 至 少 是 2， 因 为 边 a 的 代价 值 是 2。 
今 g( 功 表示 从 决策 树 的 根 到 结 点 n 的 路 径 长 度 ，h*(n) 表 示 从 结 点 n 到 目标 结 点 的 最 优 路 径 长 度 ， 
那么 结 点 1 的 代价 是 产 (0D = g(n) + h*(n)。 对 于 图 5-35 中 的 树 ，g(4) = 2，8(B) = 4，8(C) = 3。 问 
题 是 : 1*(n) 的 值 是 多 少 ? 注意 从 W 开 始 到 7 结束 有 许多 路 径 。 

下 面 是 所 有 的 这 些 路 径 ， 
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V, >V, >T (路 径 长 度 = 5) 
Vi VW >T (路 径 长 度 = 8) 
Vi>Vo Vs oT (路 径 长 度 = 10) 
Vi >V, Vo TT (路 径 长 度 = 8) 








图 5-34 说 明 4* 算 法 的 图 图 5-35 解 树 的 第 一 层 


如 果 从 V 开 始 ， 那 么 最 优 路 径 是 Vi 一 Vi 一 了 ， 路 径 长 度 是 5。 因 此 ，h*(4) 等 于 5， 这 是 Vi 一 
Vs 一 7 的 路 径 长 度 。 通 常情 况 下 ，h*(n) 对 于 我 们 是 未 知 的 ， 所 以 一 般 地产 (n) 也 是 未 知 的 。4* 算 
法 假定 仍然 能 估计 4*(n)。 再 次 参见 图 5-35， 结 点 4 对 应 于 图 5-34 中 的 V1。 从 Vi 开始 有 两 条 可 能 
的 路 线 ， 到 只， 或 者 到 ww。 比 较 短 的 一 条 路 线 是 访问 由， 其 代价 是 2。 这 意味 着 ， 从 结 点 4 开始 ， 
它 的 最 短路 径 长 度 至 少 是 2。 因 此 ，jp#( 站 至少 是 2。 现 在 可 以 标记 入 六 是 太 ( 刀 的 一 个 估计 。 

尽管 有 许多 方法 估计 h*(n)， 但 4* 算 法 保证 总 是 使 h(n) 三 h*(n)。 也 就 是 说 ， 应 该 使 用 h*(n) 
的 相当 保守 的 估计 。 这 意味 着 ， 在 A* 算 法 中 ， 总 是 使 用 f (n) = 8(n) + h(n) <g(n) + h*n) = f*(n) 
作为 代价 函数 。 后 面 在 说 明 一 个 完整 的 例子 后 这 个 概念 将 变 得 很 清楚 。 

最 后 介绍 4* 算 法 一 个 很 重要 的 性 质 。 注 意 到 A* 算 法 采用 最 佳 优 先 规则 ， 这 意味 着 在 所 有 
将 扩展 的 结 点 中 ， 选 择 具有 最 小 代价 的 结 点 作为 下 一 个 扩展 结 点 。4* 算 法 具有 下 列 终止 规则 
(termination rule); 如果 被 选择 的 结 点 也 是 目标 结 点 ， 那 么 这 个 结 点 代表 一 个 最 优 解 并 且 过 程 
可 被 终止 。 

现在 ， 解 释 为 什么 上 述 的 规则 是 正确 的 。 令 f 被 选择 为 目标 结 点 ，n 表 示 一 个 已 经 扩展 的 结 点 。 

(1) 因为 4* 算 法 使 用 最 少 代 价 优先 规则 ， 所 以 ， 对 于 所 有 的 x 都 有 f(D) Sn). 

(2) 因为 4* 算 法 使 用 h#(n) 的 保守 估计 ， 所 以 ， 对 于 所 有 nn 都 有 f O <f(n) sE. 

(3) 但 是 f*(n) 之 一 肯定 是 一 个 最 优 解 。 事 实 上 ， 令 f*(s) 代 表 一 个 最 优 解 的 值 ， 那 么 可 以 得 到 

f(t) <f*(s) 

(4) 第 3 条 陈述 表明 在 任何 时 间 ， 对 于 任何 选择 用 于 扩展 的 结 点 ， 它 的 代价 函数 将 不 超过 最 

优 解 的 值 。 因 为 十 一 个 目标 结 点 ， 所 以 有 AD =0， 并 且 
f(D = 8A) + hO = 8 
因为 上 D 为 零 ， 所 以 ， 
f(D = g(t) <f*(s) 

(5) RI, FO = g(D) 是 一 个 可 行 解 的 值 。 结 果 ，g(#) 不 能 比 f *(s) 小 。 根 据 定义 ， 这 意味 着 
a(t =f *(s)。 

我 们 已 经 阐述 了 4* 算 法 。 现 在 ， 总 结 4* 算 法 的 基本 规则 如 下 : 

(1) 4A* 算 法 采用 最 佳 优先 (或 最 少 代价 优先 ) 规则 。 换 句 话 说， 在 所 有 将 被 扩展 的 结 点 中 ， 
具有 最 小 代价 的 结 点 将 是 下 一 个 被 扩展 的 结 点 。 
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(2) 在 4* 算 法 中 ， 代 价 国 数 /Fo 定义 如 下 : 
f(n) = g(n) + h(n) 

So e(n) EM A BER REE. An) A (NATE, the An BIE Bee 
的 最 佳 路 径 长 度 。 

(3) 对 于 所 有 的 x*， 都 有 h(n) <h*(n), 

(4) 当 且 仅 当 被 选择 的 结 点 也 是 目标 结 点 时 ，4* 算 法 将 停止 ， 然 后 它 返回 一 个 最 优 解 。 

当然 ，4* 算 法 允许 使 用 其 他 的 树 搜索 规则 。 例 如 ， 参 见 图 5-36， 如 果 找 出 从 5 到 7 的 最 短路 
径 ， 那 么 可 以 观察 到 从 5 到 V; 有 两 条 路 径 ; 

S 一 2 V — V, 

S ++ V —+V, 

因为 第 二 条 路 径 的 长 度 比 第 一 条 长 ， 所 以 ， 第 二 条 路 径 将 被 忽略 ， 因 为 它 决 不 会 产生 最 优 解 。 

这 称 为 优势 规则 (dominance rule), FA 








于 动态 规划 设计 中 。 在 本 书 的 后 面 将 介绍 动 全 二 从 
态 规划 设计 。 读 者 也 许 注意 到 ， 如 果 使 用 优 10 
势 规则 ， 路 径 
savay, (San) An) el) 

也 将 被 忽略 。 > 5 

类 似 地 ， 在 分 支 限界 策略 中 所 使 用 的 限 (%) 
界 规则 也 能 在 4* 算 法 中 使 用 。 

现在 说 明 在 图 5-34 中 A* 算 法 是 如 何 找到 图 5-36 并 述 优 势 规则 的 图 


一 条 最 短路 径 的 。 步 又 1 到 7 展示 了 完整 的 过 程 。 
步骤 1. 扩展 结 点 R 





4 6 5 
g(A) =2 h(A) = min{2, 3} = 2 f(A)=24+2=4 
g(B) =4 h(B) = min{2} = 2 f(B) =44+2=6 
a(C) =3 A(C) = min{2, 2} =2 f(C)=34+2=5 


步骤 2. 扩展 结 点 A 
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g(D) =2+2=4 A(D) = min{3, 1} = 1 f(D) =441=5 
g(E)=24+3=5 h(E) = min{2, 2} = 2 f(E)=54+2=7 
步骤 3. 扩展 结 点 C 





g(F)=3+2=5 h(F) = min{3, 1} = 1 f(PF)=5+1=6 
g(G)=3+2=5 ` -A(G) = min{5} = 5 f(G)=5+5=10 
步骤 4. 扩展 结 点 D 





g(H)=2+2+1=5 h(H) = min{5} = 5 f(H)=5+5=10 
gi) =24+24+3=7 nD=0 f(D=7+0=7 
步骤 5. 扩展 结 点 B 
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eh 








g(J)=4+2=6 hJ) = min{5} = 5 f(D)=6+5=11 
步骤 6. 扩展 结 点 F 





gs(K)=3+2+1=6 h(K) = min{5}=5 f(K)=6+5=11 

e(L) =3+24+3=8 A(L) =0 f(L)=8+0=8 

步骤 7. 扩展 结 点 | 

因为 是 目标 结 点 ， 所 以 停止 并 将 以 下 作为 一 个 最 优 解 返 回 。 

Se VS> Vi 

也 许 下 面 的 问题 是 很 重要 的 能 将 4* 算 法 看 作 一 种 代价 函数 具有 聪明 设计 的 分 支 限 界 策略 
吗 ? 回答 是 肯定 的 。 当 4* 算 法 终止 时 ， 本 质 上 我 们 断言 现在 所 有 其 他 的 扩展 结 点 同时 被 这 个 可 
行 性 解 限制 。 例 如 ， 看 上 例 中 的 步骤 6， 结 点 1 相对 于 一 个 代价 为 7 的 可 行 解 。 这 意味 着 已 经 找 
到 了 这 个 问题 实例 的 一 个 上 界 ， 就 是 7。 然 而 ， 所 有 其 他 的 结 点 的 代价 都 大 于 或 等 于 7。 这 些 代 
价 也 都 是 下 界 ， 这 就 是 为 什么 能 通过 使 用 这 个 上 界 剪 去 所 有 其 余 结 点 来 终止 这 个 过 程 。 

分 支 限界 策略 是 一 个 通用 的 策略 。 它 既 不 指定 代价 函数 也 不 确定 选择 结 点 进行 扩展 的 规则 。 
MA# 算 法 指定 代价 函数 站， 它 确实 就 是 这 个 结 点 的 下 界 。A4# 算 法 也 指定 了 结 点 的 选择 规则 是 最 
少 代价 规则 。 只 要 到 达 一 个 目标 结 点 ， 那 么 上 界 就 确定 了 。 假 如 这 个 目标 结 点 较 晚 扩展 ， 因 为 
使 用 的 是 最 少 代 价 优先 规则 ， 所 以 这 个 上 界 肯 定 小 于 或 等 于 其 他 结 点 的 代价 。 又 因为 每 个 结 点 
的 代价 是 该 结 点 的 下 界 ， 那 么 这 个 上 界 小 于 或 等 于 所 有 其 他 下 界 。 因 此 ， 这 个 上 界 肯 定 是 一 个 
最 优 解 的 代价 。 


5.11 用 特殊 的 A* 算 法 解决 通道 路 线 问 题 


本 节 将 介绍 通道 路 线 问题 (channel routing problem)， 这 个 问题 起 源 于 非常 大 的 集成 计算 
机 辅助 设计 (integrated computer aided design) 系统 。 我 们 将 介绍 使 用 特定 的 4* 算 法 完美 地 解 
决 这 个 问题 。 在 这 种 特殊 的 4* 算 法 中 ， 注 意 下 列 重要 的 问题 ， 只 要 找 出 一 个 目标 结 点 ， 就 可 停 
止 并 且 返回 一 个 最 优 和 解 。 注 意 这 种 做 法 在 普通 4* 算 法 中 是 错误 的 ， 因 为 在 普通 的 4* 算 法 中 ， 
当 找 出 一 个 目标 结 点 ， 不 能 终止 算法 ， 只 有 在 一 个 目标 结 点 被 选择 用 来 扩展 时 才 终 止 算法 。 

这 种 特殊 的 4* 算 法 可 通过 图 5-37 加 以 解释 。 在 这 个 算法 中 ， 无 论 什么 时 候选 择 结 点 :， 并 
且 产 生 一 个 目标 结 点 作为 它 的 直接 后 继 。 那 么 ，h(n) = h*(1) = g(goal)—g(t), EXT ALE F, 

f (goal) = g(goal) + h(goal) = g(t) + h*(t) + 0 = fF) 
a(goal) = f (goal) = f(t) 
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注意 ,，! 是 为 了 扩展 而 选择 的 结 点 。 因 此 ， 假 如 4 是 一 个 扩展 结 点 ， 因 为 使 用 最 佳 优 先 策略 ， 
MAOS n), WREX, f(n) <An), Ak, g(goal) = 
FOSEN, FERN Bre AEE TR. 
正如 所 期 望 的 ， 函 数 h(n) 必 须 仔 细 地 设计 ， 否 则 将 不 
能 获得 好 的 结果 。 将 会 令 读 者 惊讶 的 是 对 于 本 节 定 义 的 通 gD | 
道路 线 间 题 ，h(n) 能 容易 地 设计 以 至 于 当 应 用 A* 算 法 首先 
发 现 的 目标 结 点 ， 或 者 用 另 一 种 方式 表述 ， 第 一 个 叶子 结 
点 表示 一 个 最 优 解 。 na) = A) 
现在 阐述 通道 路 线 问 题 ， 参 见 图 5-38。 有 一 个 通道 和 
两 行 终端 ， 一 行 在 顶端 ， 另 一 行 在 底部 还 有 一 套 标记 从 1 到 
8 的 网 络 集 。 例 如 ， 网 7 将 连接 顶端 的 终端 4 与 底部 的 终端 3。 
类 似 地 ， 网 8 将 连接 顶端 的 终端 2 与 底部 的 终端 8。 当 连接 这 目标 结 点 
些 终端 时 ， 不 允许 出 现 如 图 5-39 所 示 的 非法 连接 。 Os 4s ps HELA 
有 许多 连接 终端 的 方法 。 其 中 的 两 种 方式 分 别 如 图 5- BPO? ARAN AIDC RE 
40 和 图 5-41 所 示 。 对 于 图 5-40 中 的 设计 ， 有 7 条 轨迹 ， 而 图 5-41 所 示 只 有 4 条 轨迹 。 事 实 上 ， 图 
5-41 中 的 轨迹 数 是 最 少 的 轨迹 数 。 
1 2 3 4 5 6 7 8 9 i0 nN 12 B 列 序号 
4 8 0 7 0 3 6 0 0 2 1 5 0 终端 序号 


， I t1 

















| 
t 4 t 6 , 
0 0 7 0 5 4 0 8 3 0 2 6 1 列 序号 
1 2 3 4 5 6 7 8 9 0 I 2 BRES 


图 $-38 一 个 特殊 的 通道 


图 5-39 非法 的 配 线 
i 2 3 4 
1 2 3 4 
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6 7 8 9 0 HH R B 

轨迹 1 

轨迹 2 

轨迹 3 

轨迹 4 

轨迹 5 

轨迹 6 

十 ] 轨迹 7 
6 7 8 9 10 H 12 83 


图 5-40 一 种 可 行 的 设计 
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xe 
1 2 3 4 5 6 7 8 9 10 n 12 13 
4 8 0 7 0 3 6 0 0 2 1 5 0 
| 轨迹 | 
轨迹 2 
s 轨迹 3 
轨迹 4 
| 一 
0 0 了 0 5 4 0 8 3 0 2 6 1 
1 2 3 4 5 6 7 8 9 10 il 12 13 


图 $-41 一 种 最 优 设计 


通道 路 线 问题 是 发 现 一 个 有 最 少数 目 轨迹 的 设计 ， 这 已 经 被 证 明 是 一 个 NP 难 问题 。 为 了 
设计 个 解决 此 问题 的 A4* 算 法 ， 首 先 观 察 网 络 必须 服从 两 个 约束 条 件 : 水 平 约束 和 垂直 约束 。 

水 平 约束 

水 平 约束 (horizontal constrains) 可 以 通过 如 图 5-42 所 示 的 水 平 约束 图 (horizontal 
constraint graph) 来 解释 。 通 过 参考 图 5-38， 注 意 到 ， 如 果 它 们 在 同一 个 轨迹 中 ， 例 如 网 7， 必 
须 配置 到 网 3、 网 5 和 网 6 的 左边 。 类 似 地 ， 网 8 必须 配置 到 网 1 和 网 2 的 左边 。 这 些 相 关联 系 概括 
在 如 图 5-42 所 示 的 水 平 约束 图 中 。 

垂直 约束 

垂直 约束 (vertical constraints) 也 概括 在 垂直 约束 图 (vertical constraint graph) 中 ， 如 图 


siao 
O Q 


图 5-42 水 平 约束 图 图 5-43 垂直 约束 图 


再 次 参见 图 5-38， 注 意 到 当 网 1 和 网 2 共享 相同 的 终端 11 时 ， 网 1 必须 在 网 2 之 前 完成 。 类 似 
地 ， 网 3 必须 在 网 4 之 前 连 线 。 

因为 在 本 书 中 仅 关心 如 何 应 用 A* 算 法 ， 所 以 不 打算 深入 解决 通道 路 线 问题 的 细节 。 在 此 有 
许多 步骤 将 不 详细 地 解释 ， 因 为 它们 对 于 理解 4* 算 法 是 不 相关 的 。 

因为 垂直 约束 图 的 存在 ， 这 本 质 上 是 定义 了 一 个 偏 序 ， 仅 那些 在 垂直 约束 图 中 没有 前 驱 的 
网 能 分 派 给 任何 轨迹 。 例 如 ， 最 初 只 有 网 1、3、5、7 和 8 可 以 分 派 一 个 轨迹 。 假 如 1 和 3 已 经 分 
派 ， 那 么 2 和 4 才能 分 派 。 

当 垂 直 约 束 图 给 出 哪些 网 能 分 派 的 信息 时 ， 水 平 约束 图 也 提供 给 我 们 哪些 网 能 分 派 给 一 个 
轨迹 的 信息 。 因 为 我 们 感 兴趣 的 是 介绍 4* 算 法 ， 目 的 不 是 去 解决 这 个 通道 路 线 问题 ， 所 以 将 仅 
在 概念 上 而 不 是 原理 上 介绍 一 些 操作 。 参 见 图 5-43， 注 意 到 网 1，3、5、7 和 8 可 以 分 派 。 参 考 
图 $-42， 注 意 到 在 网 1、3、5、7 和 8 中 ， 有 三 个 最 大 团 (clique): {1,，8}、{1, 3, DAS, 7). 
(一 个 图 的 团 是 -- 个 子 图 ， 在 这 个 子 图 中 每 一 对 顶点 连接 ， 一 个 最 大 团 是 指 它 的 规模 不 能 再 扩 
KÉM.) 可 以 证 明 ， 每 个 最 大 团 可 以 分 派 一 个 轨迹 。 读 者 可 以 通过 参考 图 5-38 来 证 明 这 一 点 。 

使 用 这 些 规则 ， 我 们 可 以 用 树 搜索 方法 解决 通道 路 线 问 题 ， 树 的 第 一 层 如 图 5-44 所 示 。 
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为 了 进一步 扩展 这 些 子 树 ， 考 虑 结 点 (7，3，1)。 参 考 图 5-43 所 示 的 垂直 约束 图 ， 网 1、3 和 
7 分 派 后 ， 能 被 分 派 的 网 变 成 2、4、5 和 8。 类 似 地 ， 假 


如 网 1 和 8 被 分 派 ， 那 么 能 被 分 派 的 网 变 成 2、3、5 和 7。 C) 

对 于 结 点 (7，3，1) 来 说 ， 下 一 个 能 被 分 派 的 网 集合 是 

{2，4，5，8}。 再 -~ 次 参考 水 平 约束 图 5-42， 注 意 到 在 

2、4、5 和 8 中 ， 有 三 个 最 大 团 ， 即 {4，2}、{8，2} 和 Ga S (2.5) 

{5}. 这 样 ， 假如 仅 扩 展 结 点 人 7 ， 3， I}, 其 解 如 图 5-45 ` 

所 示 。 图 5-44 解决 通道 路 线 问题 的 树 的 第 一 层 
关键 问题 是 : 用 树 搜索 方法 解决 通道 路 线 问 题 的 

代价 函数 是 什么 ? 注意 对 于 4* 算 法 ， 需 要 两 个 代价 函 () 


数 ，800 和 Po)。8(9D 可 以 简单 定义 ， 因 为 树 的 层次 准 
确 对 应 于 轨迹 数 ，8( 站 能 方便 地 定义 成 树 的 层次 。 对 于 G 6.3.) 7.5) 
h(n)， 能 通过 必须 使 用 的 最 少 轨迹 数 来 估计 ， 这 个 最 少 
轨迹 数 肯定 在 已 经 分 派 的 轨迹 数目 确定 后 得 到 。 

参见 图 5-38, 注意 到 对 干 每 个 终端 , 能 画 一 条 垂 线 。 (4.2) (8.2) (Cs) 
假如 这 条 垂 线 与 :条 水 平 线 相 交 ， 那 么 需要 的 轨迹 最 小 
数目 是 x。 例 如 ， 对 于 终端 3， 最 小 轨迹 数 是 3， 而 对 于 图 5-45 图 5-44 进 一 步 扩展 的 树 
终端 7， 最 小 轨迹 数 是 4。 这 称 为 终端 ;的 本 地 密度 函数 ， 
整个 问题 的 密度 函数 是 最 大 的 本 地 密度 函数 (local 
density function)。 对 于 图 5-38 中 所 示 的 问题 ， 其 密度 
函数 是 4。 在 一 些 网 被 分 派 给 轨迹 后 ， 密 度 函数 也 会 改 
变 。 例 如 ， 网 7、3 和 1 被 分 派 后 ， 密 度 函 数 变 为 3。 现 
在 使 用 这 个 密度 函数 作为 k(n)。 图 5-46 所 示 的 是 A* 算 法 
如 何 使 用 代价 函数 工作 。 

容易 看 到 ， 对 于 使 用 的 4* 算 法 ，AD = h*(1) = 1 = 
(goal) 一 g(1)。 因 为 它 需要 至 少 1 个 轨迹 去 完成 它 的 任 
务 。 因 此 ， 结 点 /肯定 代表 一 个 最 优 解 。 

这 个 例子 显示 如 果 能 设计 一 个 好 的 代价 函数 的 话 ， 
解决 一 些 组 合 爆炸 问题 ，A4* 算 法 是 一 个 非常 好 的 策略 。 


5.12 用 A* 算 法 解决 线性 分 块 编码 译 码 问题 


设想 用 二 进 制 代码 发 送 从 0 到 7 这 八 个 数字 ， 每 个 有 
数字 需要 3 位 。 例 如 ，0 用 000 发 送 ，4 用 100 发 送 , 而 7 T“ m n ERAR 
用 111 发 送 。 假 如 有 任何 错误 ， 接 收 到 的 信号 将 错误 译 
码 。 例 如 ， 对 于 100 来 说 ， 如 果 它 被 发 送 并 且 被 接收 成 000， 将 造成 一 个 大 的 错误 。 

相反 地 ， 设 想 使 用 6 位 来 代替 3 位 编码 这 些 数字 。 参 见 表 5-13 所 示 的 编码 。 右 边 的 编码 称 为 
码 字 (code word)。 每 个 数字 的 二 进 制 形式 通过 相应 的 编码 形式 发 送 。 也 就 是 ，100 用 100110 
发 送 ，101 用 101101 发 送 。 现 在 这 种 方式 的 优点 是 显而易见 的 。 把 接收 到 的 一 个 矢量 译 码 成 一 
个 码 字 时 ， 它 的 汉 明 距离 (Hamming distance) 在 所 有 码 字 中 最 短 。 假 定 码 字 000000 被 作为 
000001 发 送 ， 那 么 能 容易 地 看 到 在 000001 和 000000 之 间 汉 明 距离 在 0000001 与 所 有 的 八 个 编码 
中 是 最 短 的 。 由 此 ， 译 码 过 程 将 0000001 译 码 为 000000。 换 句 话 说， 通过 增多 位 数 ， 可 以 元 余 
掉 更 多 的 错误 。 
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000000 
100 100110 
O10 010101 
001011 


110011 
101 101101 
Ol! 011110 
111000 





在 本 书 不 讨论 代码 是 怎样 产生 的 ， 关 于 这 些 内 容 在 编码 理论 的 书 中 都 有 介绍 。 我 们 仅 假定 
码 字 已 经 存在 ， 我 们 的 工作 是 译 码 。 在 下 面 的 例子 中 ， 这 个 编码 方案 称 为 线性 分 块 编码 
(linear block code), 

实际 上 ， 我 们 不 直接 发 送 0 和 1。 在 本 节 中 ， 假 定 1(0) 被 作为 ~1(1) 发 送 。 也 就 是 ，110110 在 
发 送 时 作为 (一 1， 一 1 ，1， 一 1， 一 1 ，1) 发 送 。 接 收 矢 量 r = (r, ra e, 7,)) 和 一 个 码 字 (c， 
c ，…，cn 之 间 的 距离 是 


dlro) = $0 -D 





假定 有 r = (-2，-2，-2，-1，-1，0 和 c = 111000。 那 么 它们 之 间 的 距离 是 
dr, c) = (-2-(- I)! + (-2-+4- D'YP + (2+ DY + (1-H IY 
+ (-1-(-1)°Y + O-(-1)°Y 
= 12 

为 了 译 码 一 个 接收 到 的 矢量 ， 简 单 地 计算 这 个 矢量 和 所 有 码 字 之 间 的 距离 ， 并 且 把 这 个 矢 
量 翻译 成 与 其 距离 最 短 的 特殊 码 字 。 实 际 上 ， 码 字 的 数目 超过 10”"， 这 是 很 大 的 数目 。 任 何 穷 
举 所 有 码 字 的 搜索 都 是 不 可 能 的 。 

我 们 使 用 一 棵 码 树 (code tree) 代表 所 有 码 字 。 例 如 ， 用 图 $-47 所 示 的 码 树 表 示 表 5-13 中 
所 示 的 所 有 码 字 。 








图 5-47 一 棵 码 树 


译 码 接收 到 的 矢量 ， 找 出 一 个 最 接近 这 个 接收 字 的 码 字 ， 现 在 变 成 一 个 树 搜索 问题 。 这 个 
问题 可 形式 化 描述 如 下 : 找 出 从 码 树 的 根 到 目标 结 点 的 一 条 路 径 ， 使 得 这 条 路 径 的 代价 是 从 根 
到 有 目标 结 点 的 所 有 路 径 中 距离 最 短 的 , 而 一 条 路 径 的 代价 是 在 路 径 中 经 过 的 所 有 分 支 的 代价 和 。 
从 在 -1 层 的 一 个 结 点 到 ! 层 的 一 个 结 点 的 分 支 代价 是 (x, 一 (一 D" 六。 我 们 将 说 明 A* 算 法 是 解决 这 
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个 问题 的 有 效 方法 。 
令 这 棵 码 树 的 根 层次 是 -1。A 是 层 上 上 的 一 个 结 点 ， 国 数 8(9) 定 义 如 下 : 


g(n) = OD) 
其 中 (ce,，c;，…，c,) 是 从 根 到 结 点 4 的 路 径 中 相关 分 支 的 标记 。 定 义 启发 函数 h(n) 如 下 


nol 


h(n) = Xil- D? 


i=f+l 


容易 看 到 ， 对 于 每 个 结 点 n 都 有 h(n) <A*(n), 
参见 图 $-47 中 的 码 树 ， 令 接收 的 矢量 是 (一 2， 
2， 一 2， 一 1， 一 1，0)， 应 用 A* 算 法 的 译 码 过 程 在 
图 5-48 中 阐述 。 
在 译 码 开 始 ， 扩 展 根 结 点 并 计算 两 个 新 产生 的 ”12 
结 点 2 和 3。f (2) 的 值 计算 如 下 : 


Ff (2) = (—2- (—1)°Y + h(2) 


=9+ Sh- 


=9+1+1+0+0+1] 
= 12 


F (3) 的 值 可 以 用 同样 的 方法 计算 。 结 点 10 是 目 
标 结 点 ， 当 它 被 选择 扩展 时 ， 过 程 将 中 止 ， 找 出 的 
最 接近 的 码 字 是 111000。 


5.13 实验 结果 


在 平均 情况 下 ， 通 过 树 搜索 技术 ， 实 验 中 的 许 
多 NP 完全 问题 能 有 效 地 解决 。 考 虑 0/1 背 包 问 题 ， 
这 是 一 个 NP 完全 问题 。 在 一 台 IBM PC 机 上 ， 用 分 
支 限 界 方法 解决 了 这 个 问题 。 测 试 的 目的 是 在 平均 
情况 下 性 能 是 否 指数 级 的 ， 表 5-14 总 结 了 测试 结果 。 
对 于 每 个 元 素 的 数目 2， 使 用 一 个 随机 数 生成 器 产生 
5 套数 据 。 在 每 一 套数 据 中 ，P; 和 W 的 值 都 在 1 到 50 之 中 。 整 数 M 按 如 下 方法 确定 。 令 W 是 所 有 
权 值 的 总 和 ， 那 么 M 设 置 成 W/4，(W/4) +20, (W4) + 40，…。 当 然 M 不 应 该 超过 W。 那 么 ， 对 
于 每 个 "， 找 出 解决 所 有 问题 实例 集 的 平均 时 间 。 

很 明显 ， 在 分 支 限界 策略 基础 上 用 这 个 算法 解决 0/1 背 包 问 题 的 平均 性 能 远 低 于 指数 。 实 
际 上 如 图 5-49 所 示 ， 它 的 性 能 几乎 是 CO(z?)。 通 过 这 些 试 验 结果 读者 应 该 受到 鼓舞 ， 不 要 害怕 
NP 完 全 问题 ， 有 许多 有 效 的 算法 解决 这 样 的 问题 ， 当 然 是 在 平均 情况 下 。 








图 5-48 一 棵 解 树 的 扩展 


表 5-14 使 用 分 支 限 界 策略 解决 0/1 背 包 问题 的 测试 结果 







平均 时 间 





平均 时 间 





10 0.025 50 0.120 
20 0.050 60 0.169 
30 0.090 70 0.198 
40 0.110 80 0.239 
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PIF 
(2) 
n 平均 时 间 n 平均 时 间 
90 0.306 200 1.167 
100 0.415 210 1.679 
{10 0.441 220 1.712 
120 0.522 230 1.972 
130 0.531 240 2.167 
140 0.625 250 2.302 
150 0.762 260 2.495 
160 0.902 270 2.354 
170 0.910 280 2.492 
180 1.037 290 2.572 
190 1.157 300 3.145 





5.14 注释 与 参考 


深度 优先 、 广 度 优先 和 最 小 代价 优 
先 搜索 技术 可 在 文献 Horowitz and 
Sahni(1976) 和 Knuth (1973) 中 找到 。 对 
于 4* 算 法 ， 可 参阅 文献 Nilsson (1980) 和 
Perl (1984)。 分 支 限 办 策略 的 完美 回顾 
可 在 文献 Lawler and Wood (1966) 和 
Mitten (1970) 中 找到 。 

人 员 分 配 问题 首先 在 文献 Ramanan， 
Deogun and Liu(1984) 中 讨论 。 文 献 
Liang (1985) 说 明了 通过 分 支 限 界 方法 
解决 这 个 问题 。 使 用 分 支 限 界 方法 解决 
旅行 商 问 题 ， 可 参阅 文献 Lawier、 ets 
Lenstra, Rinnooy Kan and Shmoys 1 2 A + + 5 -+ sho 
(1985)fiLittle, Murty, Sweeney and n 
Karel (1963)。 使 用 分 支 限界 方法 解决 旅 。 图 5-49 使 用 分 支 限界 策略 解决 /1 背包 问题 的 试验 结果 
行商 问题 也 出 现在 文献 Yang，Wang and Lee(1989) 中 。 文 献 Wang and Lee (1990) 提 出 的 4* 算 法 
是 解决 通道 路 线 问题 的 一 项 好 技术 。4* 算 法 应 用 于 线性 分 块 编码 问题 可 在 文献 Ekroot and 
Dolinar (1996); Han, Hartmann and Chen(1993) 和 Han，Hartmann and Mehrotra (1998) 中 找到 ， 
相关 的 工作 也 可 文献 Hu and Tucker(1971) 中 找到 。 


5.15 进一步 的 阅读 资料 


树 搜索 策略 是 十 分 自然 并 且 便 于 应 用 。 对 于 树 搜索 算法 的 平均 情况 分 析 ， 我 们 推荐 文献 
Brown and Purdom (1981); Huyn, Dechter and Pearl (1980), Karp and Pear! (1983), 还 有 
Purdom and Brown (1985)。 对 于 分 支 限 界 算法 ， 我 们 推荐 文献 Boffey and Green (1983); Hariri 
and Potts (1983); Ibaraki (1977); Sen and Sherali (1985), Smith (1984), 还 有 Wah and 
Yu(1985)。 对 于 4* 算 法 ， 我 们 推荐 文献 Bagchi and Mahanti (1983); Dechter and Pearl (1985), 
Nau, Kumar and Kanal (1984); Pearl (1983); 以 及 Srimani (1989), 

关于 最 近 的 研究 成 果 ， 可 参阅 文献 Ben-Asher，Farchi and Newman (1999); Devroye 


O(n?) 


CPU 时 间 (S) 
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(2002); Devroye and Robson (1995); Gallant, Marier and Storer (1980); Giancarlo and Grossi 
(1997); Kirschenhofer, Prodinger and Szpankowski (1994); Kou, Markowsky and Berman 
(1981); Lai and Wood (1998); Lew and Mahmoud (1992); Louchard, Szpankowski and Tang 
(1999); Lovasz, Naor, Newman and Wigderson (1995); and Meleis (2001), 


习题 
51 在 下 面 的 图 中 ， 使 用 某 种 树 搜索 技术 找 出 一 条 哈密 顿 回路 。 


SF 


5.2 从 下 面 的 初始 状态 开始 测试 ， 解 决 8 数码 问题 。 














注意 最 终 的 目标 是 








HA 
Pato [s | 


53 用 分 支 限界 策略 找 出 下 图 从 w 到 ww 的 最 短路 径 。 
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5.5 RTA PRAM. S={7, 1, 4, 6, 14, 25, 5, 8}, HAM = 18。 使 用 分 支 限界 策略 ， 找 
到 一 个 其 元 素 和 为 M 的 子 集 。 
5.6 使 用 某 项 树 搜索 技术 解决 下 面 图 的 顶点 覆盖 问题 。 








57 使 用 树 搜索 技术 确定 下 列 布尔 公式 的 可 满足 性 。 
(a) —X, VX, VX, 
X, VX, 
X> 
(b) ~X, VX% VX, 
XVX 
-X,V X, 
—X, 
(c) X, VX VX, 
-X V-X, V-X; 
(d) X, VX; 
-X,VX, 
一 Xi 
5.8 考虑 在 习题 5.6 中 的 图 ， 这 个 图 是 2 可 着 色 吗 ?用 树 的 某 种 搜索 技术 回答 这 个 同 题 。 
59 参见 下 图 ， 通 过 树 搜索 证 明 这 个 图 包含 一 个 3 团 。 





5.10 设计 一 个 试验 测试 在 分 支 限界 策 略 基础 上 解决 旅行 商 问题 算法 的 平均 情况 下 的 性 能 。 
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在 本 章 中 ， 将 讨论 一 种 称 为 剪 枝 搜索 (prune-and-search) 的 很 好 的 算法 设计 策略 。 该 方法 
可 以 解决 许多 问题 ， 尤 其 是 优化 问题 ， 且 通常 能 给 出 有 效 的 算法 。 例 如 ， 当 维 数 固定 上 时， 可 以 
使 用 剪 枝 搜索 策略 在 线性 时 间 内 解决 具有 2 个 约束 的 线性 规划 问题 (linear programming 
Problem)。 在 接 下 来 的 几 节 中 ， 先 介绍 剪 枝 搜索 策略 的 一 般 步 又 ， 然 后 讨论 一 些 可 用 该 策略 有 
效 解决 的 问题 。 


6.1 方法 概述 


前 枝 搜 索 策略 通常 由 几 次 秋 代 组 成 。 在 每 次 迭代 中 ， 它 剪除 输入 数据 的 一 部 分 ， 比 如 fE 比 
例 的 数据 ， 然 后 递归 地 调用 相同 的 算法 处 理 剩余 的 数据 来 解决 问题 。p 次 迭代 之 后 ， 输 入 数据 
的 规模 变 为 ?9， 此 时 4 很 小 ， 可 以 在 常数 时 间 c' 内 直接 解决 。 此 类 算法 的 时 间 复 杂 度 分 析 如 下 : 
设 每 次 迭代 执行 剪 枝 搜索 的 时 间 为 O(*9 ， 其 中 此 为 常数 ， 且 剪 枝 搜 索 算 法 的 最 坏 情况 下 执行 时 
WATA, ABA 

T(n) = T(—f )n) + O(n‘) 
可 以 得 到 
T(n) <T(U—f )n) + ent 1 足够 大 时 
<T((1—f Yn) + cn‘ + cf Ynt 


<e' + cent +c(l—f Fn + cf nk + e + ef ynt 
=c'+cn'[1 +(1-f) + (ff) + + If)" ) 
由 于 IF<1， 当 2 一 时 ， 
T(n) = O(n’) 
上 面 的 公式 表明 整个 剪 枝 搜索 过 程 的 时 间 复 杂 度 与 每 次 迭代 的 时 间 复 杂 度 是 同 级 的 。 
6.2 选择 问题 


给 定 n 个 元 素 ， 要 求 确定 其 中 的 第 Kk 小 元 素 。 解 决 该 问题 的 一 种 方法 是 先 将 n 个 元 素 排序 ， 
然后 从 有 序 序列 中 确定 第 K 小 元 素 。 因 为 排序 算法 的 时 间 复 杂 度 是 O(n log n)， 所 以 这 也 决定 了 
该 方法 在 最 坏 情 况 下 的 时 间 复 杂 度 是 O(n log n)。 在 本 节 中 ， 将 看 到 应 用 剪 枝 搜 索 策略 可 以 在 
线性 时 间 内 解决 选择 问题 (select problem) 。 中 位 数 问 题 (median problem), ， 即 找 出 第 [n/2] 
小 元 素 ， 是 选择 问题 的 特例 。 这 样 ， 中 位 数 问题 也 可 以 在 线性 时 间 内 完成 。 

在 线性 时 间 内 用 剪 枝 搜索 解决 选择 问题 算法 的 基本 思想 是 确定 不 包含 第 kK 小 元 素 的 那 部 分 
元 素 ， 在 每 次 迄 代 时 将 该 部 分 剪除 。 从 6.1 节 中 我 们 知道 ， 要 得 到 O(n) 时 间 的 算法 ， 必 须 在 每 
次 选 代 时 用 Oo 时 间 剪 去 部 分 元 素 。 下 面 将 看 到 ， 每 次 欠 代 时 用 于 搜索 的 时 间 是 可 以 忽略 的 。 

令 5 表 示 输 入 数据 集合 ，p 为 5 中 某 元 素 。 可 以 把 5 分 成 5,、52 和 5; 三 个 子 集 ， 其 中 5 中 包含 
所 有 小 于 p 的 元 素 ，5; 中 包含 所 有 等 于 p 的 元 素 ，5; 中 包含 所 有 大 于 p 的 元 素 。 如 果 51 集 合 中 的 元 
素 个 数 大 于 k， 那 么 可 以 确定 5 的 第 k 小 元 素 就 在 S, 中 ， 并 且 在 接 下 来 的 迄 代 中 可 以 剪 去 5, 和 5;， 
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么 5 的 第 k 小 元 素 必 大 于 p。 这 样 ， 可 以 丢弃 $, 和 5,， 在 下 次 迭代 时 ， 重 新 开始 从 5; 中 找 出 第 (k 一 


ISS 小 元 素 。 


关键 点 是 如 何 选择 P， 使 在 每 一 次 迭代 时 都 能 丢弃 3 的 一 部 分 ， 不 管 该 部 分 是 8%,、9: 还 是 9;。 


可 以 按 如 下 方法 选择 PP: 首先 ， 将 n 个 元 素 分 成 
每 5 个 元 素 形成 一 个 集合 的 fa/151 个 子 集 。 如 果 


己 知 IS 中 至 少 14 元 素 小 十 或 等 十 p 








需要 ， 可 以 在 最 后 的 子 集 中 加 入 虚拟 元 素 ~。 然 Se 

后 ， 对 每 个 5 元 素 子 集 排序 ， 从 每 个 子 集中 选 出 gy 

中 位 数 形成 新 序列 M = {m,, m, ， msi}， TBR 

并 令 p 为 M 的 中 位 数 。 如 图 6-1 所 示 ，5 中 至 少 有 YN 

1/4 元 素 小 二 或 等 于 p， 至 少 1/4 的 元 素 大 于 或 等 。 新 

Tp. LLRISH ELA A PRE Fp 
这 样 ， 如 果 按 照 这 种 方法 选择 p， 那 么 在 每 图 6-! 选择 过 程 中 点 的 剪除 

次 选 代 时 总 能 剪 去 8 中 至 少 w4 的 元 素 。 现 在 叙 

述 算法 如 下 。 


算法 6-1 找 出 第 k 小 元 素 的 剪 枝 搜索 算法 

输入 : nr 元素 集合 5。 

输出 : S 中 第 人 小 元 素 。 

步骤 1. 如 果 ISI 和 55， 那么 用 任意 塞 力 方法 解决 该 问题 。 

步骤 2. 将 8 分 成 [1S1 全 了 集 ， 短 个 子 集 含 有 5 个 元 素 。 如 玉 4 不 是 5 的 倍数 ， 那 么 在 最 后 的 子 集 中 加 入 一 些 虚 拟 
© LK» 

RS. WHET CRETE. 

步骤 4. 递归 地 找 出 ay 中 个 子 集 中 位 数 的 中 位 数 p。 

WBS. 将 5 分 成 S$,/、5; 和 S;， 使 各 自 包含 的 元 素 分 别 小 十、 等 十 和 大 于 p。 

HME. 如 果 IS4 之 kK， 都 么 丢弃 5, 和 5S;， 在 下 次 迄 代 有 时， 解决 从 5, 中 找 出 第 小 元 素 的 问题 ， 格 则 ， 如 果 IS, + 154 之 
k, MApASP Beh CR. BM, Sko=k-1S I-18, E PURI RS PENER. 


令 7 为 上 面 叙述 的 从 中 选择 第 小 元 素 算法 的 时 间 复杂 度 。 由 于 每 个 子 集 包含 常数 数目 
的 元 素 ， 所 以 每 个 子 集 排 序 用 常数 时 间 。 这 样 ， 步 又 2、3 和 5 可 以 在 O(a) 时 间 内 完成 。 如 果 弟 
归 地 使 用 相同 的 算法 ， 从 fn/5] 元 素 中 找到 中 位 数 ， 那 么 步骤 4 需要 T( fn15]) 时 间 。 因 为 在 每 次 
迭代 时 都 剪 去 至 少 w4 个 元 素 ， 步 又 6 中 最 多 包含 3n14 个 元 素 ， 因 此 可 以 在 T( [3n14]) 时 间 内 守 
成 。 所 以 ， 

T(n) = T(3n/4) + T(ni5) + O(n) 


AT(n) = apt antan +>, a, #0, 


得 到 
(=n) = ay + 2amn+ Zan + 
(=n) = ay + Sans aan + 
T(rn+ 3 = rfn) = ay + ans E ag t 
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将 6.1 节 中 得 到 的 公式 用 于 该 不 等 式 ， 得 到 
T(n) = O(n) 
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6.3 两 变量 线性 规划 


很 长 时 间 以 来 ， 线 性 规划 的 计算 复杂 度 一 直 是 引起 计算 机 领域 科学 家 极 大 兴趣 的 主题 。 尽 
管 Khachian 提 出 了 一 种 聪明 算法 ， 指 出 线性 规划 问题 可 以 在 多 项 式 时 间 内 解决 ， 然 而 ， 由 于 其 
中 涉及 的 常数 太 大 ， 因 此 该 算法 仅 具 有 理论 价值 。Megiddo 和 Dyer 各 自 独立 地 提出 了 在 O(n) 时 
间 内 ， 解 决 固定 变量 数 的 线性 规划 问题 的 藤 枝 搜索 策略 ， 其 中 的 为 约束 的 数目 。 

在 本 节 中 ， 我 们 将 描述 他 们 提出 的 解决 两 变量 线性 规划 问题 的 技术 。 特 殊 的 两 变量 线性 规 
划 间 题 定义 如 下 : 

最 小 化 ax + by 

约束 为 ax + pyDci i=l, 2, =, n 

用 剪 枝 搜索 策略 解决 两 变量 线性 规划 问题 的 基本 思想 是 总 有 些 与 解 无 关 的 约束 ， 因 此 可 以 
前 去 它们 。 在 剪 枝 搜索 方法 中 ， 每 次 迭代 之 后 会 有 一 部 分 约束 被 前 去 。 数 次 迭代 之 后 ， 约 东 的 
数目 变 得 很 小 ， 使 线性 规划 问题 可 以 在 常数 时 间 内 解决 。 

为 了 简化 讨论 ， 描 述 用 于 解决 简化 的 两 变量 线性 规划 问题 的 剪 枝 搜索 方法 : 

最 小 化 y 

ZIRA yeaxtb, i=l, 2, …,n 

考虑 图 6-2， 总 共有 8 个 约束 ，(xo，y0) 为 最 优 解 。 

由 于 对 所 有 i，y 之 ax + b;。 我 们 知道 最 优 解 必 位 于 围绕 可 行 区 域 的 边界 上 ， 如 图 6-2 所 示 。 
对 于 每 个 *:， 边 界 F(x) 必 定 在 所 有 n 个 约束 中 有 最 大 值 。 也 就 是 ， 


F(x) = max{a,x +b} 


其 中 ax + b 为 输入 约束 。 最 优 解 xo 满 足以 下 方程 : 


F(x) = _max F(x) 


做 下 面 的 假定 : 
(1) 选择 一 个 点 zm， 如 图 6-3 所 示 。 
(2) 由 于 某 些 原因 ， 可 知 ro 和 xz。 
在 这 种 情况 下 ， 考 虑 
y=axtb, 
与 y=ax+b, 
这 两 条 直线 的 交点 位 于 x 的 右 方 。 在 这 两 条 直线 中 ， 当 x<x。s 时 ， 其 中 一 条 小 于 另 一 条 。 这 
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-约束 可 以 删 去 ， 因 为 它 不 会 是 边界 的 一 部 分 ， 如 图 6-4 所 示 。 


aex+b ax+b agxt by 





图 6-2 特殊 两 变量 线性 规划 问题 的 例子 图 6-3 两 变量 线性 规划 问题 中 可 以 消去 的 约束 


这 样 ， 如 果 选 择 了 x,,， 且 已 知 Xo<x,， 那 
么 可 删除 cx + b,, 

类 似 地 ， 由 于 axx + b, 5a,x + bs 的 交点 在 
x MAW. wx Hx, Ft, agx + 
bax + bp;， 所 以 可 以 将 约束 asx + bs 删除 。 

一 般 来 说 ， 如 果 有 一 个 zw， 使 得 最 优 解 
Xo<xXm， 且 两 个 输入 约束 aix + b Fax + bb, 的 ; 
交点 位 于 xX, 右 方 ， 那 么 当 x<x, 时 ， 其 中 的 一 XO Xp 
个 约束 总 是 小 于 另 一 个 。 所 以 ， 总 是 可 以 删 
除 这 个 约束 ， 因 为 它 不 影响 最 优 解 的 搜索 。 

读者 -- 定 注意 到 只 能 在 知道 m<z 的 情况 下 ， 才 可 删除 约束 ax + b,。 换 言 之 ， 假 设 正在 搜 
索 过 程 中 ， 沿 着 边界 从 x 到 x0 方 向 搜索 ， 才 可 以 消除 aix +b, BAM <x, ax + b1 对 结果 的 
搜索 没有 帮助 。 必 须 注意 wx + b 是 可 行 区 域 边界 的 一 部 分 ， 但 这 种 情况 只 有 当 x>x 时 才 成 并 。 

如 果 xo>x,,， 那 么 对 于 交点 位 于 x 之 左 的 所 有 约束 对 ， 当 x>x 时 ， 必 有 一 个 约束 小 于 另 一 
个 ， 可 以 删 去 此 约束 而 不 会 影响 解 。 

我 们 仍 需 回答 如 下 两 个 问题 : 

(1) 假设 已 知 x， 如 何 得 知 搜索 的 方向 ”也 就 是 说 ， 如 何 知道 是 rr<z 还 是 zo>zm? 

(2) 如 何 选择 xzv? 

现在 回答 第 一 个 问题 。 假 设 已 选 定 x,。 令 


Yn = Fx) = max{a;x + b} 


cm 


显然 ，Ccv,，ym) 是 可 行 区 域 边界 上 的 点 ， 有 两 种 可 能 : 

情况 1. y REDARE, 

情况 2. y, 在 若干 约束 的 交点 上 。 

对 于 情况 1， 简 单 查看 该 约束 的 斜率 sg。 如 果 g>0， 那 么 xo<xs， 如 果 g>0， 那 么 xo>x。。 如 
图 6-5 所 示 。 

对 于 情况 2， 计 算 下 列 各 式 : 


Bmax = Max{a;: ax +b, = F(x,,)} 
I<icn 


y 





图 6-4 为 什么 约束 可 以 消去 的 说 明 
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Emin = min{a, +X), +b, = FQ} 


换言之 ， 在 (x,,，y,) 彼 此 相交 的 所 有 约束 中 ， 设 gwi, 和 8g, 分 别 为 这 些 约束 的 最 小 和 最 大 和 斜 
率 ， 那 么 ， 有 三 种 可 能 性 : 

(1) 情况 2a: gms>0 且 gmx>0。 此 时 ，xo<x。 

(2) 情况 2b: Emin LOH 8 max<O. 此 时 ， Xo? X no 

(3) 情况 2c: gwi,<0 且 8%.>0。 此 时 ，(x,,，y) 为 最 优 解 。 
三 种 情况 如 图 6-6 所 示 。 


y 





图 6-5 _xw 只 在 一 个 约束 上 的 情况 图 6-6 ,在 数 个 约束 的 交点 上 的 情况 


我 们 已 经 回答 了 第 一 个 问题 。 现 在 来 回答 第 二 个 问题 : 如何 选 择 x,,? 应 按 如 下 方法 选择 x,: 
按 选 定 的 线 对 ， 使 得 两 两 直线 的 交点 中 一 半 交 点 位 于 Xx 之 左 ， 一 半 位 于 Xi 之 右 。 这 意味 着 对 nn 
个 约束 ， 可 以 把 它们 任意 分 为 mn2 组 。 对 每 一 对 ， 找 到 它们 的 交点 。 在 所 有 1/2 个 交点 中 ， 让 zw 
为 其 x 坐 标的 中 点 。 


在 算法 6-2 中 ， 给 出 基于 剪 枝 搜索 策略 寻找 特殊 线性 规划 问题 的 最 优 解 的 详细 算法 。 


算法 6-2 ”解决 特殊 线性 规划 问题 的 剪 枝 搜 索 算 法 

输入 : “AR: S: axt+b, i=1, 2, =, n 
输出 : 在 约束 y>>ax+ (i=1, 2, +, n) 下 ， 使 得 在 x 值 处 > 最 小 。 
步骤 1. 如 果 $ 包 含 不 多 于 两 个 约束 。 那 么 用 某 种 蛮 力 算法 解决 该 问题 。 
步骤 2. 将 5 分 成 n/2 对 约束 ， 对 每 对 约束 ax + bi 与 ax + 乌 ， 求 出 它们 的 交点 Py， 将 其 x* 坐 标 值 记 为 es 
步骤 3. 在 所 有 中 〈 最 多 有 /2 个 ) ， 找 到 中 点 zw。 
DRA. 确定 yw = F(x,)= max{a,x,, + b} 

P= max{a, ax +b; = F(x,,)} 


gmin = Min{a; :a,x,, +b, = F(x,,)} 
1<ism 


步骤 5. 情况 5a: 如 果 8w 与 8Sww 符 号 不 同 ， 那 么 yw 为 所 求解 ， 退 出 。 
情况 5b: 和 否则， 如果 gwiw>0， 那 么 ko<xwi 如 果 8mn<0， 那 么 xo>xwm。 

步骤 6. 情况 6a: 如 果 xro<xw， 那 么 对 交点 的 x* 坐 标 大 于 xm 的 点 对 ， 对 于 x* 和 xm， 剪 去 两 约束 中 的 小 者 。 
情况 6b: 如 果 xo>xw， 那 么 对 交点 的 x 坐 标 小 于 xm 的 点 对 ， 对 于 x*> xxw， 剪 去 两 约束 中 的 小 者 。 
令 S 表 示 剩 余 的 约束 ， 转 至 步骤 2。 





对 上 面 算法 的 复杂 性 分 析 如 下 : 由 于 两 直线 的 交点 可 在 常数 时 间 内 找到 ， 因 此 步骤 2 可 在 
O(n) 时 间 内 完成 。 由 6.2 节 可 知 中 点 可 在 O(n) 时 间 内 找到 。 步 又 4 可 通过 线性 扫描 所 有 约束 完成 。 
这 样 ， 步 骤 4 和 5 可 在 O(n) 时 间 内 完成 。 步 骤 6 也 可 通过 扫描 所 有 相交 直线 对 在 O(n) 时 间 内 完成 。 

由 于 使 用 选择 的 交点 的 中 点 ， 它 们 中 的 一 半 位 于 x 的 右 方 ， 总 共有 |n12] 个 交点 。 对 每 个 
交点 剪 去 一 个 约束 。 这 样 ， 在 每 次 迭代 后 剪 去 |214| 个 约束 。 基 于 6.1 节 的 结果 ， 上 面 算法 的 时 
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间 复 杂 度 为 O(n)。 
现在 回 到 最 初 的 两 变量 线性 规划 问题 。 该 问题 定义 如 下 : 
最 小 化 Z=ax+by 
约束 为 ax+by>c, i=1, 2, =, n 
现在 举 一 个 典型 例子 : 
最 小 化 Z= 2x + 3y 
约束 为 x 和 10 
y<6 
x-y2>1 
3x + 8y>30 
这 些 约束 形成 一 个 可 行 区 域 ， 如 图 6-7 所 示 。 
在 图 6-7 中 ， 每 条 虚线 代表 
Z=2x + 3y 
可 以 想象 这 些 直 线形 成 一 系列 平行 线 。 最 优 解 位 于 (38/11，27/11) ， 即 第 一 条 虚线 与 可 行 
区 域 相 交 的 地 方 。 


2y +3y= 32 js x=10 





y=6 


2x + 3y = 38 


= x 
ma ` < 3x + 8y = 30 
图 6-7 一 般 的 两 变量 线性 规划 问题 


可 以 将 上 面 一 般 的 两 变量 线性 规划 问题 转变 成 一 个 仅 最 小 化 > 值 的 问题 。 我 们 的 原始 问题 为 : 
最 小 化 Z= ax + by 
WRAax+by>c;, i=1, 2, =, n 
BLA x! = x 
y'=ax + by 
那么 原 问 题 变 为 
最 小 化 y' 
约束 为 ai'x'+b'y'>c i=1, 2, =, n 
其 中 a'=a; 一 bal/b 
b'=b/b 
GG 
因此 ， 可 以 说 一 般 的 两 变量 问题 可 以 经 过 n 步 后 转化 成 下 面 的 问题 : 
最 小 化 y 
HRA ax+bySc;, i=1, 2,.…,n 
读者 应 当 注 意 到 上 面 的 问题 与 特殊 两 变量 线性 规划 问题 有 一 点 不 同 。 在 特殊 两 变量 线性 规 
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划 问 题 中 ， 定 义 问 题 为 
最 小 化 y 
YHA ySaxt+b, i=1, 2, “yn 
但 是 ， 在 一 般 情况 下 有 三 种 约束 : 
y>ax + b, 
y<ax +b, 
和 a<x<b 
考虑 图 6-7 中 的 四 种 约束 ， 它 们 是 
x<10 
y<6 
x-y21 
3x + 8y>30 
可 以 将 上 面 的 公式 改写 成 
x<10 
y<6 
y<x-1 


oe 
yan 


8 

可 以 将 变量 的 正 (1) 系数 的 分 组 约束 在 集合 nz) 中 ， 那 么 原始 问题 变 为 

最 小 化 y 

约束 为 y>ax+b (ic I) 

y<ax+b, (i Eh) 
a<x<b 

定义 两 个 函数 : 

F(x) = max{ ax + b;:i€ h} 

F(x) = min{ ax+b,:i€ 1}. 

F (x) —-7 4) RAE oh AK F(x) 是 一 个 
分 段 线性 媚 函 数 。 两 个 函数 及 约束 a<x<b 确 
定 了 线性 规划 问题 的 可 行 区域 ， 如 图 6-8 所 示 。 

这 样 ， 原 始 2 变量 线性 规划 问题 可 以 进 一 
步 转化 成 ' | 
最 小 化 Fi(x) a b 





丝 为 F <F. 
TRA Fie) SFG) 图 6-8 两 变量 线性 规划 问题 的 可 行 区 域 
axx<b 


在 此 ， 再 次 指出 如 果 知 道 搜索 方向 ， 那 么 一 些 约束 可 以 被 剪 掉 。 其 原因 与 特殊 2 变量 线性 
规划 问题 中 讨论 的 一 样 。 考 虑 图 6-9， 如 果 知 道 最 优 解 zx 位 于 xn 的 左 方 ， 那 么 可 以 删除 cx + b, 
而 不 影响 解 ， 因 为 当 x<x, 时 ，awx + b< ax + b。 我 们 知道 这 种 情况 是 因为 ax + by) Sax + b, 的 
交点 位 于 xz 的 右 方 。 同 样 ， 可 以 消去 asx + ba HAH, ax + bs> asx + bso 

读者 现在 注意 到 ， 解 决 2 变量 线性 规划 问题 的 剪 枝 搜索 算法 中 最 重要 的 问题 是 确定 zx 《最 
优 解 ) 位 于 x 的 左 方 或 右 方 。x, 的 解 能 以 类 似 在 特殊 2 变量 线性 规划 问题 中 的 方法 解决 。 
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通常 ， 已 知 一 点 %,，a<x,<b， 需 要 确定 下 面 的 问题 : 

(1) zw 可 行 吗 ? y 

(2) 如 果 x 可 行 ， 那么 必须 确定 最 优 解 x。 
位 于 其 左 ， 还 是 其 右 。 也 可 能 出 现 x, 本 身 即 
最 优 解 的 情况 。 

(3) 如 果 元 ,不 可 行 ， 那 么 必须 确定 是 否 存 
在 可 行 解 。 如 果 可 行 解 存在 ， 那 么 必须 确定 
该 最 优 解 位 于 x 的 哪 一 方 。 

接 下 来 ， 将 描述 该 决策 过 程 。 考 虑 F(x) 
= (x) 一 F(x)， 显 然 ， 当 且 仅 当 F(x,)<0 时 ， 
Xn 可 行 。 为 了 确定 最 优 解 位 于 哪 一 边 ， 我 们 
定义 如 下 : 

8min = min{ai: iE J, ax, +b;=F, (x,)} 

Emax = Max{a;: iET, ax, +b;=F, (x,)} 

hmin = min{a;: iEL, ax,, +b, = F, (x,,)} 

hna = Max{a;:iE1,, ax,, +b, = F, (x,,)} 

考虑 下 面 的 情况 : 

情况 1. F(x,)<0。 这 意味 着 x 是 可 行 的 。 

CL) 如 果 gwin>0 且 gm.>0， 那 么 xo<x,,， 如 图 6-10 所 示 。 

(2) 如 果 gis.<0 且 gmwio<0， 那 么 xo>x,,， 如 图 6-11 所 示 。 


y 





图 6-9 一 般 两 变量 线性 规划 问题 中 约束 的 剪除 





204 Xn Xm? Xo 
图 6-10 8min d0 E 8m ORINE 图 6-11 8min CSOB Sn <0 的 情况 
(3) 如 果 gwn<0 且 guv>0， 那么 x 为 最 优 解 ， 如 图 6-12 所 示 。 


情况 2. Fan) >0。 这 意味 着 是 不 可 行 的 。 
(1) ANR 8min > hwax， 那 么 Xo<%,， 如 图 6-13 所 示 。 


2 y 





图 6-12 Smw<0 且 gww >0 的 情况 图 6-13 8min > hma 的 情况 
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(2) MURS max < wins 那么 xo>xw， 如 图 6-14 所 示 。 


(3) ANRE min < Amar E8 max Z Amin» 那么 不 存在 可 行 解 ， 因为 F(X) 在 x 处 取得 最 小 值 ， 如 图 6-15 
所 示 。 


y 


Iaa Xo 





图 6-14 gmax < hm 的 情况 图 6-15 Emin S Anar P8 mas > Amin AOL 
上 面 的 决策 过 程 总 结 为 如 下 的 程序 。 


程序 6-1 算法 6-3 中 使 用 的 程序 
输入 : 某 点 的 x 坐标 值 x,,。 


I: yor tb i=1, 2, -, a 
lh; ySax +b, i=nj+1, ni+2, = j 
a<x<b 
输出 :从 ,继续 搜索 是 否 有 意义 。 如 果 有 意义 ， 那 么 输出 搜索 的 方向 。 
步骤 1. F(x) = max{ax + b;: i El} 
F(x) = mix{ax + b;: iE h} 
F(x) = Fi(x)—F,(x) 
步骤 2. gmin = min{a, iE, aXn + bi= Find} 
Bmax = Max{ai: i EL, aX, + b= F(xm)} 
Ain = Minka; >i Ely, Ay + bi = F(xn)} 
hma = MAX{G, > HE 1y, Xp + b, = Fx,,)} 
步骤 3. 情况 1: Fan) <0. 
(a) 如 果 gwis>0 且 gm.>0， 那 么 输出 “xo<x。”， 并 退出 。 
(b) 如 果 gwii<0 且 gmx<0， 那 么 输出 “xo>x。”， 并 退出 。 
(C) 如 果 gis<0 且 gmx>0， 那 么 输出 “是 最 优 解 "， 并 退出 。 
情况 2: F(x,,)>0. 
(a) 如 果 gwin>hms， 那 么 输出 “xo<x”， 并 退出 。 
(O) 如 果 gwax<hwis， 那 么 输出 “xo>x。”， 并 退出 。 
(C) BFE Brin hn 且 8max 之 hmn， 那 么 输出 “不 存在 可 行 解 "， 并 退出 。 


解决 2 变量 线性 规划 问题 的 剪 枝 搜索 算法 如 下 。 
算法 6-3 ”解决 2 变量 线性 规划 问题 的 剪 枝 搜索 算法 


> n 


MA: L: yeaxtb, i=1, 2,0, M 
l; ySax+b, i=njt+1, n+2, =, n 
asx<b 


输出 : 在 以 下 约束 下 ，y 取 得 最 小 值 时 的 xo 值 
lypax+b, i=1, 2, ,hn 
ySax +b, i=n, +1, nyt 2s oye 
axx<b 


ee I Iaa aaa aa 
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(28) 
步骤 1. WR SLPWARLRS FAT, WZ AR ee RZ ae 
步骤 2. 将 /中 的 约束 分 成 不 相交 的 对 ， 同 样 ， 将 /中 的 约束 也 分 成 不 相交 的 对 。 对 每 一 对 ， 如 果 aix + 4 平行 于 
ax +b, HUF, FEL, bbi, JEL, b>b, MAMPRax+ bs EU, Ky = ax + bi 与 y= ax +b 的 
交点 py。 令 Pi 的 x 华 标 为 x,。 
步骤 3. eM ino 
步骤 4. 对 ,应 用 程序 6-1。 
如 果 志 ,是 最 优 的 ， 那 么 输出 ,并 退出 。 
如 果 无 可 行 解 存 在 ， 那 么 输出 该 信息 并 退出 。 
步骤 5. 如 果 x。>x 
IHE; <x, Ai, GEL, MRa<a,, MAWKL Ry Sax + bis 
人 否则， 剪除 约束 y> ax + bj。 
AMER, <x, Li, jE h, WRa>a, WAWKA Hy <a + bs 
人 否则， 剪除 约束 y 科 wx + bj。 
如 果 x0<x 
RHE Dn Ai, JEn, MRa >a, BAWKL Ky >an + bj 
否则 ， 剪 除 约束 y>> ax + bj。 
MHER x >x, Ai, JEL, MRa<a,, MAW Ky Sax + b; 
否则 ， 剪 除 约束 y 科 ax + bjo 
步骤 6. 转 到 步 又 1。 


因为 每 次 迭代 都 可 以 剪 去 [n/4| 个 约束 ， 而 在 算法 6-3 中 的 每 一 步 需 花 费 O(n) 的 时 间 ， 所 以 
很 容易 得 出 此 算法 是 O(n) 阶 的 。 


6.4 1 圆心 问题 


1 圆心 问题 (1-center problem) 定义 如 下 : 给 定 m 个 平面 点 的 集合 ， 要 找到 一 个 覆盖 所 有 几 
个 点 的 最 小 圆 。 图 6-16 给 出 了 一 个 典型 示例 。 

在 本 节 中 ,将 给 出 一 个 基于 剪 枝 搜索 策略 解决 1 圆心 问题 的 方法 。 该 问 的 输入 数据 为 "个 点 。 
在 每 一 步 里 ， 剪 除 不 影响 最 终 解 的 1116 的 点 ， 基 于 剪 枝 搜索 解决 1 圆心 问题 的 方法 只 需 线性 时 
间 ， 因 为 在 每 一 步 中 它 所 需要 的 时 间 都 是 线性 的 。 

图 6-17 给 出 前 枝 搜 索 方 法 的 例子 。Lis; 和 L3s 分 别 是 连接 p1 与 p，， 以 及 p3 与 ps 线段 的 垂直 平分 
线 。 假 设 还 知道 最 优 解 的 圆心 位 于 阴影 区 域 ， 现 在 考虑 ZL,。 因 为 Ls 没有 与 阴影 区 域 相交 ， 两 
点 中 必 有 其 一 离 最 优 解 圆心 近 。 在 我 们 的 例子 中 ，p1ttps 接 近 于 圆心 。 这 样 ，p1 可 以 删除 掉 ， 
因为 它 不 影响 结果 。 





图 6-16 1 圆心 问题 图 6-17 1 圆心 问题 中 剪除 点 的 可 能 情况 


重要 的 是 ， 需 要 知道 最 优 解 圆心 位 于 哪 一 部 分 ， 还 需 知 道 哪些 点 比 其 他 点 离 圆 心 近 ， 这 些 
较 近 的 点 可 以 删除 。 
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在 给 出 1 圆心 问题 通用 算法 前 ， 先 介绍 一 种 有 约束 的 1 圆心 问题 的 算法 ,约束 圆心 在 一 条 直 
线 上 。 这 一 方法 将 作为 一 个 子 程序 被 通用 1 圆心 方法 调用 。 不 失 一 般 性 ， 假 定 直线 为 ?= y'。 


算法 6-4 解决 有 约束 1 圆心 问题 的 算法 
输入 : "个 点 和 一 条 直线 y = y'。 
输出 : 在 直线 y =) LALOR. 
步骤 1. 如 果 2 不 大 二 2， 那么 用 塞 力 方法 解决 该 问题 。 
步骤 2. EVE RABE, pd. Po Pdr o> Pras Pho RAAT, BARGES RMA, Pio 
步骤 3. 对 每 个 点 对 (p;， Piri)» 求 出 在 直线 y= y' 上 的 点 cr， 使 得 d(p;， Xian) = d(pis 1, Kiis 1)o 
步骤 4. R [412] 个 i, 的 中 点 ， 记 为 x。。 
步骤 5. 对 所 有 的 i， 计 算 p; 与 x 的 距离 。 今 pj 为 离 记 最 远 的 点 ， 元 表示 p) 在 y =v LAR. WR EKA CB) 
方 ， 那 么 最 优 解 x* 必 位 于 的 左 ( 右 ) 方 。 
步骤 6. 如 果 x*<x,,，( 如 图 6-18 所 示 ) 
对 每 个 i; Am 如 果 疡 比 P; ， 距 局 近 ， M2 BA Apis 否则 ， BA HP... 
如 果 x >x,, 
对 每 个 i <n Mp tke. Hl, BARR, GM, HEAP. 
步骤 7. Hay R1, f 


由 于 在 x*, 左 (E) 边 有 |n/4] 个 xi; A ATE ARREA RAe. TAH 
去 [12/14| 个 点 ， 每 次 迭代 花费 C(0OD) 时 间 。 这 
样 ， 该 算法 的 时 间 复 杂 度 为 

T(n) = T(3n/4) + O(n) = 0(n)， 随 着 n 一 % 

在 此 需 强调 ， 有 约束 1 圆心 问题 算法 将 
用 于 主 算法 中 以 求 得 最 优 方 案 。 有 约束 1 贺 
心 问题 算法 中 剪除 的 点 仍 被 主 算法 使 用 。 图 6-18 有 约束 的 1 圆心 问题 中 点 的 剪除 

现在 考虑 一 个 较为 复杂 的 问题 。 设 想 有 
一 个 点 集 和 一 条 直线 y = 0， 如 图 6-19 所 示 。 
使 用 有 约束 1 圆心 算法 可 以 确定 x* 在 直线 上 


的 确切 位 置 。 实 际 上 ， 利 用 该 信息 ， 可 以 做 = y=0 





更 多 的 事情 。 令 (x,，y,) 为 包括 所 有 点 的 最 优 
解 圆心 ， 可 以 确定 是 否 y,>0、y,<0 或 y, = 0。 
4 、 日 不 
H o RE WTAE AE E> 9. ASO 图 619 AORAR OER 
令 / 表 示 距 离 点 (tx* ，0) 最 远 点 组 成 的 集合 ， 有 两 种 可 能 的 情况 。 
情况 1. /包括 一 个 点 ， 记 为 p。 
这 种 情况 ，p 的 x 坐标 必定 等 于 x*。 若 非 如 此 ， 那 么 可 以 将 x* 沿 直线 y = 0 向 p 移 动 ， 这 与 (x*， 
0) 为 最 优 解 的 假设 相 巴 盾 。 这 样 ， 如 果 p 为 距 (x*，0) 最 远 的 唯一 点 ， 那 么 它 的 x 值 必定 等 于 x*， 
如 图 6-20 所 示 。 可 以 推断 y, 与 p 的 y 坐 标 有 相 p 
同 的 正 负 号 。 
情况 2. I 包含 多 于 一 点 。 
在 集合 I 所 有 的 点 中 ， 找 出 复 盖 I 中 所 有 


点 的 最 小 缴 。 今 缴 的 两 个 匾 点 为 Pi 和 P2。 如 - y=0 
果 该 缴 的 度数 大 于 或 等 于 180"， 那 么 y, = 0; * 


EM, Sy Apty#wR, Ye = (yi + y2)/2。 这 图 6-20 /只 包含 一 点 的 情况 
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FOR 
样 ， 的 正 负 号 与 六 的 相同 。 这 些 情况 分 别 如 图 6-21a、b 所 示 。 下 面 对 其 进行 讨论 。 

现在 考虑 第 -- 种 情况 ， 也 就 是 覆盖 m n 
所 有 最 远 点 的 最 小 弧 ， 其 度数 大 于 等 于 n Rs 
180* 的 情况 。 注 意 包含 某 点 集 的 最 小 圆 ， a aa 
该 点 集 由 这 些 点 中 的 两 个 或 三 个 确定 ， y=0 vee 
如 图 6-228、b 所 示 。 三 个 点 确定 了 包括 N 
它们 三 个 点 在 内 的 最 小 贺 的 边界 ， 当 且 户 Ps 
仅 当 它们 不 形成 钝 角 三 角形 (如 图 6-22b a) b) 
所 示 ) ， 否 则 ， 可 以 用 三 边 中 的 最 长 边 图 6-21 /包含 多 于 一 点 的 情况 


为 直径 的 圆 来 代替 该 圆 (如 图 6-22c 所 
示 )。 在 此 情况 下 ， 因 为 覆盖 所 有 最 远 点 的 弧 ， 其 度数 大 于 等 于 180"， 那 么 最 少 有 三 个 这 样 的 
最 远 点 ， 而 且 这 三 个 最 远 点 不 形成 钝 角 三 角形 。 换 和 揣 话 说 ， 当 前 的 最 小 圆 已 是 最 优 的 。 进 而 可 
以 推断 和 =0。 

对 于 槛 盖 所 有 最 远 点 的 缴 ， 其 度数 小 于 180*" 的 第 二 种 情况 ， 首 先 看 到 端点 Pi 和 Pa 的 x 坐 标 正 
负 号 必定 相反 。 若 非 如 此 ， 如 图 6-23 所 示 ， 可 以 将 x 朝 p, 和 p, 位 置 的 方向 移动 。 这 是 不 可 能 的 ， 
因为 x* 是 在 y = 0 的 最 优 圆心 上 。 





a) b} c) 





图 6-22 两 点 或 三 点 确定 覆盖 所 有 点 的 最 小 图 图 6-23 度数 小 于 180" 时 x* 的 方向 


令 P =(a, b), p=(c, d, 不 失 一 般 性 ， 可 以 假定 a>x*，b>0 和 c<x*，d<0， 如 图 6-24 所 
示 。 在 图 6-24 中 有 三 个 圆 ， 圆 心 分 别 位 于 (x*， 
0)，(a, b) 和 (c,d)。 这 三 个 圆 形成 四 个 区 域 : 
R!、R,、R; 和 Rs4。 令 当前 圆 的 半径 为 '， 有 下 
面 三 个 结论 : 

(1) 在 R, 中 ， 在 该 区 域 中 任意 点 x 与 p ,或 
Dp; 之 间 的 距离 大 于 r。 因 此 ， 最 优 贺 的 圆心 位 
BAER KIRA. 

(2) 在 R, 中 ， 在 该 区 域 中 任意 点 x 与 p; 的 
距离 大 于 r。 因 此 ， 最 优 加 的 圆心 位 置 不 在 R， 
区 域内 。 

(3) 同 理 ， 很 容易 看 出 最 优 圆 的 圆心 也 
不 在 R 区 域内 。 

基于 上 面 三 个 结论 ， 可 以 推断 最 优 圆 心 
必 蓝 在 区 域 久 内 ， 进 而 ，y 必 定 有 与 (+ d)/2 
= (y, + y)/2 相 同 的 正 负 号 。 

上 面 的 程序 可 以 总 结 如 下 。 图 6-24 度数 大 于 180° 时 x* 的 方向 
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程序 6-2 算法 6-5 中 使 用 的 程序 
输入 : HERS 
直线 y = y*。 
(yy): IFS, Ey = y* 上 有 约束 1 阅 心 问题 的 解 。 
输出 : 是否 y,> y ，y.<y 或 vy,=y ， 其 中 (xs，ys) 是 $5 的 1 圆心 问题 的 最 优 解 。 
步骤 1. RAER, y ) 最 远 点 的 集合 /。 
步骤 2. 情况 1;， /只 包含 -- 点 p = p Yo 
如 果 w > 站， 那么 输出 “y> y”， 并 退出 。 
如 果 y, < ， 那 么 输出 “w< y”， 并 进出 。 
情况 2: /包含 多 于 一 个 的 点 。 在 /中 找到 形成 覆盖 所 有 /中 点 的 最 小 绝 的 陋 个 端点 pl = (x1，30) 与 p; = Or. 
Yade 
情况 2.1: 六 和 P: 形 成 的 弧 的 度数 大 于 等 于 180 `。 
输出 “y, =y”， 并 退出 。 
情况 2.2，p, 和 ip; 形 成 的 弧 的 度数 小 于 180”。 令 y. = y + y2)/2。 
如 果 y,> y ， 那 么 输出 “y,>>y”， 并 退出。 
如 果 y.< y ， 那 么 输出 “yw<Y"， 并 退出 。 


有 约束 的 1 圆心 算法 可 以 用 来 剪除 点 。 在 给 出 精确 的 算法 前 ， 考 虑 图 6-23。 对 于 点 对 (p， 
pP2) 和 (p;，ps)， 分 别 画 出 线段 DP, 和 PsP, WBA PEARL ALa SL AML MET— Ap. Wess 
HELA MRR, L-A ERR, HEr 
系 的 原点 移 至 p， 先 应 用 有 约束 的 1 圆心 算法 
求 出 在 y = 0 的 圆心 。 找 到 该 有 约束 的 1 圆心 
后 ， 使 用 程序 6-2 找 出 最 优 解 ， 确 定 最 优 解 的 
y 方 向 ， 在 例子 中 应 该 向 上 。 重 复 该 过 程 将 
有 约束 的 1 圆心 算法 应 用 于 x = 0， 然 后 找到 x 
方向 ， 在 例子 中 应 该 向 左 移动 。 因 此 ， 最 优 
位 置 必定 在 阴影 区 域内 ， 如 图 6-25 所 示 。 因 
为 有 一 条 垂直 平分 线 与 阴影 区 域 不 相交 ， 总 uea: 
是 可 以 利用 该 信息 移 除 所 考虑 的 一 个 点 。 图 6.25 BRANE 

在 例子 里 ,Ls 不 与 阴影 区 域 相交 ， 点 p, 位 于 阴影 区 域 一 方 ， 这 意味 着 只 要 最 优 圆心 限定 于 
阴影 区 域内 ， 点 p, 离 最 优 圆心 的 距离 总 比 ps 小 。 因 此 ， 可 以 删 去 点 p1， 因 为 它 被 点 p 所 “支配 ”。 
也 就 是 说 ， 只 需 考虑 p, 即 可 。 

下 面 是 用 剪 枝 搜索 解决 1 圆心 问题 的 算法 。 











算法 6-5 解决 1 圆心 问题 的 剪 枝 搜索 算法 
输入 : n 个 点 的 集合 $= {P Pr s 
输出 : 包括 S 中 所 有 点 的 最 小 封闭 贺 。 
步骤 1. 如 果 5 包 含 不 多 于 16 点 ， 那 么 用 蛮 力 方法 解决 该 问题。 o 
步骤 2. ERRATA, Po pads (Pas Pads =’ Pais Pho HEDA O, Pi), RBRB PPan 的 垂直 
平分 线 ， WAL, i=2, 4, --, A, 并 计算 它们 的 斜率 ， 将 L 的 斜率 表示 为 5s， k=1, 2, ++, n/2。 
PRS. 计算 s% 的 中 点 ， 表 示 为 sw。 
PW. 旋转 坐标 系 使 * 坐 标 与 ? = sux 重合 。 令 上 中 斜率 为 正 ( 负 ) 组 成 的 集合 为 1*( 丰 。( 两 者 数目 均 为 n/4)。 
PRS. 构建 不 相交 的 直线 对 (L;,，L; )，i = 1，2，…，n/4， 其 中 ,EE 1* ，L- E 三 。 找 到 每 对 直线 的 交点 ， 表 示 
Ala, b), i=1, 2, 0, n/4。 
步骤 6. 找 出 b 的 中 点 ， 表 示 为 y。 对 5 应 用 有 约束 的 1 图 心 子 程序 求 得 在 y = 了 上 的 圆心 。 令 有 约束 的 1 圆心 问题 的 
解 为 (x'，y')。 


Pate ’ 
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步骤 7. WASH, y ) 作 为 参数 ， 应 用 程序 6-2。 
如 果 w =y ， 那 么 输出 “步骤 6 中 找到 的 以 (x'，y) 作 圆心 的 圆 为 最 优 解 "， 并 退出 ， 
否则 ， 和 输出 w> > 或 w< y 。 
步骤 8. 求 a 的 中 点 ， 表 示 为 x 。 对 5 应 用 有 约束 的 1 圆心 子 程序 求 得 在 x =x 上 的 圆心 。 令 有 约束 的 1 圆心 问题 的 解 
Ha, y) 
步骤 9. 以 S 和 (x'"，y ) 作 为 参数 ， 应 用 程序 6-2。 
如 果 x, =x ， 那 么 输出 “ 步 又 8 中 找到 的 以 (x ，y” 作 圆心 的 圆 为 最 优 解 "， 并 进出 ， 
AM, tHe, > 或 +.<x。 
步骤 10. 情况 1: x> Hy y 
找到 所 有 aw<* Hby Ha, b). Fla, bYAL AIL, WIE (MARS), L Ap Alp Aye. 4n 
Kplp tty, (PB. yt, WAHR). 
情况 2: x< Ay >y 
找到 所 有 ai>x* Hb <y Wa, b) Fla, b)AL ANIL WK, Le Ap Alp AVE ae. ARP (p tb 
PAP) BX, y iE, KZ 89 Kpop). 
情况 3: x.<x Hy, y 。 
找到 所 有 ai>x Hb>y Wa, b), Fla, b)ALe, LWA, Li 为 pj 和 pi 的 平分 线 。 如 果 pj(pj) 比 
PAP) BX ， yE, MLKP). 
情况 4: x >x Hy <y 
RAMA a > Hby 的 (a;，bi)。 令 (qj， DDAL, LZA, LeAp AMP MVEA. Rpte 
PPB, yE, WARP). 
步骤 11. SARAH. EPEL, 


对 算法 6-5 分 析 如 下 。 首 先 假定 对 于 某 个 k， 有 n = 16' 个 点 ，k 为 常数 ， 在 步骤 2 中 形成 了 n/2 
条 垂直 平分 线 。 在 步骤 4 之 后 ， 有 /4 的 垂直 平分 线 为 负 斜 率 ，m/4 的 为 正 斜 率 。 这 样 ， 在 步骤 5 
中 总 共有 7m/4 个 交点 。 因 为 (> ) 是 ai (b,) 的 中 
点 ， 对 步骤 10 的 每 种 情况 ， 有 (n/4)/4 = n/16 个 
(a;，b;)， 如 图 6-26 所 示 ， 假 定 最 优 圆心 位 于 
阴影 区 域内 。 然 后 ， 对 x>x% 和 y>y 区 域 中 的 
每 个 交点 对 ， 位 于 负 和 斜率 直线 下 方 的 点 可 以 
剪 去 。 对 每 个 这 样 的 (a;，b;)， 都 剪除 一 个 点 。 
因此 ， 在 每 个 交点 中 ， 有 n/16 个 点 被 剪除 。 

容易 看 出 算法 6-5 的 每 一 步 花 费 O(n) 时 
间 。 这 样 ， 算 法 6-5 总 的 时 间 复 杂 度 为 O(n)。 


6.5 实验 结果 图 6-26 不 相交 点 对 及 其 斜率 








为 了 说 明 剪 枝 搜索 方法 的 能 力 ， 我 们 实现 了 对 1 圆心 问题 的 剪 枝 搜索 算法 。 该 问题 还 有 另 
一 种 解决 方法 。 注 意 到 1 圆心 问题 的 解 必须 经 过 至 少 三 个 点 。 因 此 ， 可 以 尝试 每 三 个 点 的 组 合 。 
也 就 是 选择 三 个 点 ， 构 造 一 个 圆 ， 看 它 是 否 覆盖 了 所 有 的 点 。 如 果 不 能 ， 那 么 丢弃 它 。 如 果 可 
以 ， 那 么 记 下 它 的 半径 。 当 检查 了 所 有 这 些 贺 后 ， 可 以 找到 最 小 圆 。 这 样 ， 这 是 一 种 O(n ) 的 
方法 ， 而 剪 枝 搜索 方法 则 是 一 种 O(n) 的 方法 。 

我 们 在 IBM PC 上 实现 了 上 述 两 种 方法 。 直 接 方法 用 穷 举 搜索 标明 。 所 有 数据 都 是 随机 产 
生 的 。 实 验 结果 如 表 6-1 所 示 。 

显然 在 该 情况 下 ， 剪 枝 搜索 非常 有 效 。 当 为 150 时 ， 穷 举 搜索 已 经 比 剪 枝 搜索 差 多 了 。 当 
1 为 300 时 ， 穷 举 搜索 用 的 时 间 太 长 以 致 无 法 完成 。 而 用 剪 枝 搜索 则 只 需 257 秒 就 可 解决 1 圆心 问 
题 。 有 如 此 结果 并 不 奇怪 ， 因 为 一 种 方法 的 复杂 度 为 Or)， 而 另 一 种 方法 的 复杂 度 为 O(0D)。 
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表 6-1 实验 结果 

样本 点 数 穷 举 搜索 8 前 梳 搜 索 s 
17 1 ! 
30 8 11 
50 28 32 
100 296 83 
150 1080 130 
200 2408 185 

, 250 2713 232 
300 — 257 


6.6 注释 与 参考 


解决 选择 问题 的 方法 传统 上 归 入 分 治 策略 ， 我 们 认为 归 入 剪 枝 搜索 更 为 恰当 。 更 详尽 的 讨 
论 参 阅 文献 Blum，Floyd，Pratt，Rivest 及 Tarjan (1972) 和 Floyd 与 Rivest (197$)。 选 择 问 题 下 界 
的 讨论 参阅 文献 Hyafil (1976)。 许 多 教科 书 也 提供 了 解决 选择 问题 的 聪明 方法 (Brassard 和 
Bratley, 1988; Horowitz 和 Sahni,，1978; Kronsjo, 1987), 

6.3 节 中 的 聪明 方法 是 由 Dyer (1984) 与 Megiddo (1983) 分 别 独立 发 现 的 。Megiddo (1984) 将 
结论 推广 到 更 高 维 数 。Megiddo (1983) 同 样 提 到 1 圆心 问题 可 以 采用 剪 枝 搜索 方法 实现 ， 这 推翻 
了 Shamos 和 Hoey (1975) 的 推测 。 


6.7 进一步 的 阅读 资料 


剪 枝 搜索 方法 相对 较 新 ， 与 其 他 领域 相 比 ， 在 这 一 领域 中 的 文献 较 少 。 我 们 建议 把 以 下 材 
料 作 为 进一步 研究 的 资料 : Avis, Bose, Shermer, Snoeyink, Toussaint and Zhu (1996), 
Bhattacharya, Jadhav, Mukhopadhyay and Rober (1994); Chou and Chung (1992); Imai 
(1993); Imai, Kato and Yamamoto (1989); Imai, Lee and Yang (1992); Jadhav and 
Mukhopadhyay (1993); Megiddo (1983); Megiddo (1984); Megiddo (1985); and Shreesh, 
Asish and Binay (1996), 

最 新 出 版 的 有 意义 的 论文 可 参阅 : Eiter and Veith (2002); ElGindy, Everett and Toussaint 
(1993); Kirpatrick and Snoeyink (1993); Kirpatrick and Snoeyink (1995); and Santis and 
Persiano (1994), 
习题 
6.1 确信 自己 弄 清楚 了 分 治 法 与 剪 枝 搜索 法 的 相同 点 与 不 同 点 。 注 意 递 归公 式 看 起 来 相当 相似 。 
6.2 写 一 个 程序 实现 本 章 中 介绍 的 选择 算法 。 找 出 第 k 大 元 素 的 另 一 种 方法 是 先 应 用 快速 排序 ， 然 

后 从 中 挑 出 第 人 大 元 素 。 同 样 实现 该 方法 并 比较 两 段 程序 ， 给 出 测试 结果 的 解释 。 

6.3 RA 上 的 两 个 点 集合 4 和 8B 称 为 线性 可 分 (linearly separable), ， 如 果 存 在 一 个 (d-1) 维 超 平面 使 4 和 

B 分 别 位 于 其 两 人 出 。 试 证 明 线性 可 分 问题 是 一 种 线性 规划 问题 。 

6.4 根据 习题 6.3 中 的 结论 ,证明 两 维和 三 维 的 线性 可 分 问题 可 在 O(n) 时 间 内 完成 。 
6.5 阅读 文献 Horowitz 与 Sahni(1978) 中 的 定理 3.3。 它 是 基于 剪 枝 搜索 方法 的 对 选择 算法 的 平均 情况 

的 分 析 。 





第 7 章 动态 规划 方法 


动态 规划 策略 (dynamic programming strategy) 是 一 种 用 于 解决 许多 组 合 优化 问题 
(combinatorial optimization problem) 的 有 效 方法 。 在 介绍 动态 规划 方法 之 前 ， 重 新 考虑 使 用 贪 
心 法 解决 的 典型 实例 也 许 是 合适 的 。 在 此 将 给 出 贪心 法 失效 但 动态 规划 方法 却 起 作用 的 实例 。 

图 7-! 包 含 一 个 多 阶段 图 (multi-stage graph)。 假 设 要 找到 从 5 到 7 的 最 短路 径 。 在 这 种 情况 
下 ， 可 以 通过 下 列 推导 顺序 找到 最 短路 径 : 3 5 7 


(1) 由 于 知道 最 短路 径 一 定 经 过 顶点 4， 
所 以 要 找到 从 3 到 4 的 最 短路 径 ， 最 短路 径 的 aoe 工 一 7) 
代价 是 1。 





(2) 由 于 知道 最 短路 径 一 定 经 过 顶点 B， i S 
所 以 要 找到 从 4 到 8 的 最 短路 径 ， 最 短路 径 的 图 7-1 贪心 法 有 效 工作 的 实例 


代价 是 2。 

(3) 类 似 地 ， 找 到 从 8 到 7 的 最 短路 径 ， 其 代价 为 5。 

因此 ， 从 5 到 7 的 最 短路 径 的 总 代价 是 ! + 2 + 5 = 8。 总 之 ， 使 用 贪心 法 的 确 解决 了 这 个 最 
短路 径 问题 。 

为 什么 可 以 使 用 信心 法 解决 该 问题 呢 ? 能 这 样 做 是 因为 我 们 明确 地 知道 问题 的 解 必定 由 从 
5 到 4 的 子路 径 ， 从 4 到 有 的 子路 径 等 构成 。 所 以 ， 解 决 问题 的 策略 是 先 找到 从 $ 到 4 的 最 短路 径 ， 
再 找到 从 4 到 8 的 最 短路 径 等 。 

现在 给 出 一 种 贪心 法 无 效 的 实例 ， 见 图 7-2。 同 样 ， 要 找到 从 3 到 7 的 最 短路 径 。 然 而 ， 这 
次 并 不 知道 最 短路 径 要 经 过 顶点 4、B 和 C 中 的 哪 一 个 。 如 果 还 使 用 贪心 法 解决 该 问题 ， 选 择 顶 
点 4， 因 为 从 5 到 4 的 边 的 代价 最 小 。 在 选择 4 之 后 ， 接 着 选择 D。 此 条 路 径 的 代价 是 1 + 4+ 18 = 
23。 这 不 是 最 短路 径 ， 最 短路 径 应 为 5 一 C 一 F 一 7， 其 总 代价 为 5 + 2 + 2 =9。 

如 上 所 示 ， 应 选 C 而 不 是 4。 动态 规划 方法 会 通过 下 面 的 推导 方式 找 出 此 问题 的 解 。 

(1) 我 们 知道 ， 必 须 从 5 开始 ， 经 过 4、B 或 C， 这 如 图 7-3 所 示 。 因 此 ， 从 5 到 7 的 最 短路 径 
的 长 度 取 决 于 下 面 的 公式 : 

dS, T)=min{l+d(A, T), 2+d(B, T), 5+d(C, T)} (7-1) 

其 中 ，dX， 刀 表示 从 X 到 7 的 最 短路 径 的 长 度 。 当 分 别 找到 从 4、B 和 C 到 7 的 最 短路 径 后 ， 

从 S 到 7 的 最 短路 径 也 就 找到 了 。 








S—> CH FHT Cc) 


图 7-2 贪心 法 无 效 的 实例 图 7-3 使 用 动态 规划 方法 过 程 中 的 一 步 
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(2) 为 了 找到 从 A、B 和 C 到 T 的 最 短路 径 ， 可 以 再 次 使 用 上 面 的 方法 。 顶 点 4 所 得 到 的 子 图 
如 图 7-4 所 示 。 也 就 是 说 , dA, T)=min{4+d(D, T), 11+d(E, 7)}。 由 于 d(D, T)=18, de, 
T)= 13， 可 得 
d(A, D=min{4+18, 11+13}=min{22, 24} = 22 
当然 ， 必 须 记 录 下 从 4 到 D 再 到 7 的 最 短路 径 。 
类 似 地 ， 对 于 BB， 该 步骤 如 图 7-5 所 示 。 
d(B, D=min{9+d(D, T), 5+d(E, T), 16+d(F, T)} 
=min{9 +18, 5413, 16 +2} 
= min{27, 18, 18} 
= 18 
最 后 ， 很 容易 得 到 dC， 刀 为 4。 


| O. 
AI-O) Aa 


图 7-4 使 用 动态 规划 方法 过 程 中 的 一 步 图 7-5 使 用 动态 规划 方法 过 程 中 的 一 步 
(3) 在 找到 d4， 刀 、d(B， 九 和 dC， 刀 } 后 ， 可 以 通过 公式 (7-1D 得 到 dS， 刀 的 值 。 
d(S, ND=min{l +22, 2+18, 5+4} 
= min{23, 20, 9} 
=9 
动态 规划 的 基本 原理 是 把 原 问 题 分 解 到 各 个 子 问题 ， 对 各 个 子 问题 分 别 用 同样 的 方法 递归 
地 解决 。 将 该 方法 总 结 如 下 : 
(1) 为 了 找到 从 5 到 7 的 最 短路 径 ， 先 找 从 A4、B 和 C 到 7 的 最 短路 径 。 
(2) (a) 为 了 找到 从 4 到 7 的 最 短路 径 ， 要 找 出 从 D 和 E 到 7 的 最 短路 径 。 
(b) 为 了 找到 从 B 到 7 的 最 短路 径 ， 要 找 出 从 D、E 和 F 到 7T 的 最 短路 径 。 
(c) 为 了 找到 从 C 到 7 的 最 短路 径 ， 要 找 出 从 F 到 T 的 最 短路 径 。 
(3) 从 D、E 和 FF 到 7 的 最 短路 径 可 以 很 容易 地 得 到 。 
(4) 在 已 知 从 D、E 和 F 到 7 的 最 短路 径 之 后 ， 可 以 得 到 从 A、B 和 C 到 7T 的 最 短路 径 。 
(5) 在 已 知 从 4、B 和 C 到 7 的 最 短路 径 之 后 ， 可 以 得 到 从 3 到 7 的 最 短路 径 。 
上 面 的 推导 方法 实际 上 是 一 种 反 向 推导 (backward reasoning) 方法 。 接 下 来 ， 也 可 以 用 前 
向 推导 (forward reasoning) 方法 解决 此 问题 。 最 短路 径 的 求解 过 程 如 下 : 
(1) HERBS, A), a(S, B)Fild(S, C). 
d(S, A)=1 
as, By=2 
dS, C)=5 


(2) 然后 ， 确 定 d(§$，D)、d(S，E) 和 d(5 ,中 如 下 : 
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d(S, D)=min{d(A, D)+d(S, A), d(B, D)+d(S, B)} 
=min{4+1, 9+2} 
=min{5, 11}=5 
dS, E)=min{d(A, E)+d(S, A), d(B, E)+d(S, B)} 
=min{ll +1, 5+2} 
=min{12, 7}=7 
d(S, F)= min{d(B, F)+d(S, B), dC, F)+d(S, ©} 
= min{16 +2, 2+5} 
=min{18, 7} 
=7 
(3) 从 3 到 7 的 最 短路 径 可 如 下 得 到 : 
dS, TD) = min{d(D, T)+d(S, D), dE, T)+d(S, E), dF, T)+d(S, Fy} 
= min{18 +5, 13+7, 2+7} 
= min{23, 20, 9} 
=9 
动态 规划 方法 节省 计算 可 以 再 次 通过 图 7-2 进 行 解释 。 在 图 7-2 中 ， 有 一 个 解 如 下 : 
S-B-D-T, 
此 解 的 长 度 即 dS，B) + d(B, D) + d(D，D 在 使 用 反 向 推导 的 动态 规划 方法 时 是 从 不 计算 
的 。 当 使 用 反 向 的 推导 方法 时 ， 发 现 4(B，E) + dE, T)<d(B, D) + dD, T), BIE, Dii 
要 考虑 解 : 5 一 8 一 D 一 T。 因 为 知道 8 一 E 一 7 的 长 度 比 8 一 D 一 7 的 长 度 短 。 
因此 ， 像 分 枝 限界 方法 一 样 ， 动 态 规划 方法 也 能 帮助 我 们 避免 穷尽 全 部 的 解 空间 。 
可 以 说 动态 规划 方法 是 通过 分 阶段 途径 进行 的 一 种 排除 方法 ， 因 为 在 排除 某 一 个 阶段 后 ， 
许多 子 解 也 同时 排除 了 。 例 如 ， 参 见 图 7-6a。 最 初 有 八 个 解 。 如 果 使 用 动态 规划 方法 ， 解 的 数 
量 减少 到 四 个 ， 如 图 7-6b 所 示 。 


a) b) 
图 7-6 用 来 说 明 在 动态 规划 方法 中 排除 解 的 例子 


动态 规划 是 基于 称 为 最 优化 原理 (principle of optimality) 这 个 概念 的 。 假 设 在 解决 问题 时 ， 
需要 作出 一 个 决策 序列 DI，D，,，…，D,。 如 果 这 个 序列 是 最 优 的 ， 那 么 最 终 的 K1 < 上 < 由 个 决 
策 也 一 定 是 最 优 的 。 在 后 面 各 节 中 将 对 此 原理 进行 多 次 说 明 。 

应 用 动态 规划 方法 有 两 个 优点 。 如 前 所 述 ， 第 一 个 优点 是 可 以 排除 一 些 解 ， 减 少 计算 量 ， 
另 一 个 优点 是 可 以 帮助 我 们 系统 化 地 逐步 解决 问题 。 
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如 采 一 个 解决 问题 的 人 员 不 具备 任何 动态 规划 的 知识 ， 那 么 他 可 能 会 检查 全 部 可 能 的 组 合 
解 来 求解 一 个 问题 ， 这 极其 耗费 时 间 。 如 果 使 用 动态 规划 方法 ， 问 题 会 立即 变 成 一 个 多 阶段 的 
问题 ， 因 此 ， 可 以 用 非常 系统 化 的 方法 来 解决 。 随 后 这 将 变 得 更 清晰 。 


“7.1 资源 配置 问题 
资源 配置 问题 (resource allocation problem) 定义 如 下 : 已 知 m 个 资源 和 n 个 项 目 。 将 j (0< 
/<m) 个 资源 配置 给 项 目 i 时 ， 可 得 到 利润 P(i， 让 。 问 题 是 要 找到 资源 配置 的 最 大 总 利润 。 


假设 有 四 个 项 目 和 三 个 资源 ， 利 润 矩阵 (profit matrix) PRAT, MTB, PU, 
0) =0。 


表 7-1 利润 矩阵 


项 日 BO 











为 了 求解 该 回 题 ， 做 出 一 个 决策 序列 。 在 每 次 决策 时 ， 确 定 配置 给 项 目 ;的 资源 数 。 不 失 
一 般 性 ， 必 须 决 定 : 

(D 应 当 给 项 县 1 配置 多 少 资源 ? 

(2) 应 当 给 项 目 2 配置 多 少 资源 ? 


显然 ， 贪 心 法 在 这 种 情况 下 是 无 效 的 。 然 而 ， 可 以 用 动态 规划 方法 来 求解 。 如 果 使 用 动态 
规划 方法 ， 可 以 设想 每 次 决策 将 产生 一 个 新 的 状态 。 令 (i, 四 表示 i 个 资源 已 配置 给 项 目 1， 
2，…，j 所 得 到 的 状态 。 那 么 ， 最 初 只 有 四 个 描述 的 状态 ， 如 图 7-7 所 示 。 

在 将 i 个 资源 配置 给 项 目 ! 之 后 ， 至 多 可 以 配置 (3 一 让 个 资源 给 项 目 2。 因 此 ， 第 二 阶段 决策 
与 第 一 阶段 是 相关 的 ， 如 图 7-8 所 示 。 


Oo /oo lr \O 
keo] 





图 7-7 资源 配置 问题 的 初始 阶段 决策 图 7-8 资源 配置 问题 的 前 两 阶段 的 决策 


最 后 ， 图 7-9 显 示 如 何 表述 整个 问题 。 

为 了 解决 资源 配置 问题 ， 只 需要 找到 从 5 到 7 的 最 长 路 径 ， 使 用 反 向 推导 的 方法 如 下 : 

(1) 从 I、J、K 和 L 到 7 的 最 长 路 径 如 图 7-10 所 示 。 

(2) 如 果 已 经 获得 从 I、J、K 和 L 到 7 的 最 长 路 径 ， 那 么 很 容易 得 到 从 E、F，、G 和 H 到 7 的 最 
长 路 径 。 例 如 ， 从 E 到 7 的 最 长 路 径 确 定 如 下 : 
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aE, T)= max{d(E, D+d(ll, D, dE, N+dVJ, T), 
aE, K)+d(K, T), dE, L)+d(L, D} 
= max{0 +5, 4+4, 4+2, 4+0} 
=max{5, 8, 6, 4} 





图 7-9 资源 配置 问题 表示 为 多 阶段 图 
图 7-11 总 结 了 此 阶段 的 结果 。 


O 
OF 
2 

(x) 0 


图 7-10 从 1、J、K 和 到 7 的 最 长 路 径 图 7-11 从 E、F、G 和 有 到 7 的 最 长 路 径 


(3) 从 A、B、C 和 D 到 7 的 最 长 路 径 可 以 用 同样 的 方法 分 别 得 到 ， 如 图 7-12 所 示 。 
(4) 最 后 ， 从 5 到 7 的 最 长 路 径 可 以 按 如 下 方法 得 到 : 
d(S, T)=max{d(S, A)+d(A, T), dS, B)+d(B, T), 
dS, C)+d(C, T), dS, D)+d(D, T) 
=max{0 +11, 2+9, 8+5, 9+0} 
=max{ll, 11, 13, 9} 
=13 
RKRBESSCH-L-T, 
对 应 的 资源 配置 是 
2 个 资源 配置 给 项 目 1， 
1 个 资源 配置 给 项 目 2， 
0 个 资源 配置 给 项 目 3， 
以 及 0 个 资源 配置 给 项 目 4。 


7.2 最 长 公共 子 序列 问题 


考虑 一 个 字符 串 4 = ap a a d e。A4 的 一 个 子 序列 是 通过 从 4 中 删 去 0 个 或 更 多 个 (不必 是 连 
续 的 ) 字符 得 到 的 。 例 如 ， 下 面 字 符 串 都 是 4 的 子 序列 : 








图 7-12 从 4、B、C 和 D 到 7 的 最 长 路 径 
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a 

b 

d 

ab 

aa 

bd 

ae 

aba 

aaa 

ade 

bade 

aaad 

abade 

4 和 8B 间 的 公共 子 序列 定义 为 两 个 字符 串 的 共同 子 序列 。 例 如 ， 考 虑 4 = a b a a d e c 和 B = 
caacedc, 下面 的 字符 串 是 4 和 8 的 公共 子 序 列 : 

a 

d 

c 

ad 

dc 

aa 

ac 

aac 

aad 

aaec 

最 长 公共 子 序 列 问题 (longest common subsequence problem) 是 要 找到 两 个 字符 串 间 最 长 
的 公共 子 序列 。 许 多 问题 都 是 最 长 公共 子 序列 问题 的 变形 。 例 如 ， 语 音 识别 问题 (speech 
recognition problem) 可 以 看 成 是 最 长 公共 子 序列 问题 。 

对 于 一 位 初学 者 ， 最 长 公共 子 序列 问题 决 不 是 容易 解决 的 。 直 接 的 方法 是 通过 穷尽 搜索 来 
找到 全 部 的 公共 子 序 列 。 当 然 ， 要 从 可 能 最 长 的 子 序列 开始 。 两 个 字符 串 的 最 长 公共 子 序 列 的 
长 度 不 能 比 原 字符 串 中 较 短 的 长 。 因 此 ， 应 该 从 较 短 的 字符 串 开 始 。 

例如 ， 令 4 =abaadec 及 B = bafc。 可 以 尝试 确定 b af c 是 否 公 共 子 序列 。 可 以 直观 地 
看 出 它 并 不 是 。 接 下 来 从 B 中 选择 长 度 为 三 的 子 序列 进行 尝试 ， 即 a fc、b fc、b a c 和 b af。 因 
为 b a c 是 一 个 公共 子 序 列 ， 那 么 它 也 一 定 是 最 长 公共 子 序列 ， 因 为 这 是 从 最 长 的 可 能 子 序列 开 
始 的 。 

这 种 直接 方法 是 非常 消耗 时 间 的 ， 因 为 大 量 B 的 子 序 列 数 目 要 与 大 量 4 的 子 序列 数目 相 匹 
配 。 因 此 ， 这 是 一 个 指数 增长 的 过 程 。 

幸运 的 是 ， 可 以 使 用 动态 规划 方法 解决 这 种 最 长 公共 子 序 列 问题 。 先 稍微 修改 一 下 初始 问 
题 。 先 不 找 最 长 公共 子 序列 ， 而 是 尝试 确定 最 长 公共 子 序列 的 长 度 。 事 实 上 ， 通 过 追溯 寻找 最 
长 公共 子 序列 长 度 的 过 程 ， 很 容易 找到 最 长 公共 子 序列 。 

考虑 两 个 字符 串 4 =aa a, fB = b1b,…b,。 注 意 最 后 两 个 字符 : a 和 b,。 有 两 种 可 能 性 : 

情况 1: a, = 5b,。 在 此 情况 下 ， 最 长 公共 子 序列 一 定 包含 a,,， 所 以 仅 需 要 找到 a14a，…aw-, 和 
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bby b, 的 最 长 公共 子 序 列 。 
情况 2: a +b, EWERT, Bea Ba,a,---a,5b,b,---b,. 匹配， 也 可 以 将 qia2…4 1 与 
bp,…b, 匹 配 。 无 论 哪 个 产生 的 较 长 的 最 长 公共 子 序列 ， 它 都 是 最 长 公共 子 序列 。 
AL, 表示 aias…ai 和 4b.b，,…b 的 最 长 公共 子 序列 的 长 度 。L; 可 以 从 下 面 的 递归 公式 得 到 : 
Laja tl 如 果 a, =b, 
oa {esd ta. 如 果 a = b, 
Loo = hy = Lio=0, 对 于 l<i<m, Il&j<n 
上 面 的 公式 表明 可 以 首先 找到 二 ,。 在 找到 ZL 之后， 可 以 找到 L, ,和 LL |. ERL, n L 
和 后， 可 以 找到 ZL ;、L.; 和 LL 1!。 整 个 过 程 在 图 7-13 中 进行 了 描述 。 
为 了 顺序 地 实现 该 算法 ’ 可 依次 计算 每 个 L; 的 值 : Ly le Ly 25 Ly. 3a 75 Ly no Ly L3 
Ly no Ly by 77% La, no 由 于 计算 每 个 L; 需要 L L L 
常数 的 时 间 ， 因 此 算法 的 时 间 复杂 度 为 ”| k i 
O(mn), 
现在 用 -个 例子 说 明 这 种 动态 规划 方 AJN 
法 。 令 A =abcd 和 B =cbd。 在 这 种 情况 下 ， 2.1 La 
我 们 有 | 


a,=c | 
aas=d . ~ 
b, Sec 一 人 Ln.n 


图 7-13 用 动态 规划 方法 解决 最 长 公共 子 序列 问题 
及 b,=d, 


最 长 公共 子 序列 的 长 度 可 以 逐步 得 到 ， 如 表 7-2 所 示 。 


表 7-2 L, 的 值 











7.3 2 序列 比 对 问题 


令 A = aaya, FOB = bib，…b, 为 字母 集 > 上 的 两 个 序列 。4 与 8 的 序列 比 对 是 一 个 在 ZU{ 一 } 
中 的 2 xk 字 符 和 矩阵 M (Kk>>m，n)， 使 得 M 中 没有 列 完全 由 短 模 线 组 成 ， 并 且 对 M 中 的 第 一 行 和 第 
二 行 的 全 部 短 横 线 进 行 移动 而 得 到 的 结果 序列 分 别 与 4 和 B 相 同 。 例 如 ， 如 果 4 = a bc d 和 B = 
bd， 它 们 的 一 个 可 能 的 比 对 是 

abc-d 

—-cbd 
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间 样 这 两 个 序列 的 另 一 个 可 能 的 比 对 是 

abcd 

cb—d 

可 以 看 出 第 二 个 比 对 好 像 比 第 一 个 更 好 。 更 精确 地 ， 需 要 定义 一 个 可 以 用 来 衡量 比 对 性 能 
的 得 分 国 数 (scoring function)。 下 面 将 给 出 这 个 函数 。 可 以 想像 得 到 ， 一 定 还 可 以 定义 其 他 
的 得 分 函数 。 

令 f (x，y) 表 示 x 与 y 比 对 的 得 分 。 假 设 x 和 y 都 是 字符 ， 如 果 x 与 y 相 同 ， 那 么 f (x，y) = 2， 如 
果 x 与 y 不 同 ， 那 么 f(x，y) = 1， 如 果 x 或 者 y 是 “一 "， 那 么 f(x, y)= 一 1。 

一 个 比 对 的 得 分 是 所 有 列 的 字符 比 对 得 分 的 总 和 ， 那 么 下 面 比 对 的 得 分 是 一 1 一 1 + 2 一 1 + 2 
=l, 

a—bcd 

—cb-d 

下 面 比 对 的 得 分 是 1 + 2-14+2=4, 

abcd 

cb—d 

A 和 B 的 2 序列 比 对 问题 (2-sequence alignment problem) 是 找到 具有 最 多 得 分 的 两 序列 最 
优 比 对 。 与 用 来 找到 最 长 公共 序列 的 递归 公式 相似 ， 其 递归 公式 也 可 以 公式 化 。 令 4; 表示 aia: 

…aj 与 bib，…b) 间 的 最 优 比 对 ， 其 中 1<i<m，1 <j<n。 那 么 ，A; 可 以 表示 如 下 : 

40o=0 | 

Aio=i: f(a, —) 

Ao j=j 了 (一 ， bj) 

Aij + fla, M 
A; = max Aaa t Aaa 
A; ja + f(b; 六 


有 必要 将 上 面 的 递归 公式 进行 一 下 解释 : 

ho 是 初始 状态 。 

A; o 表 示 a!，a,，…，4a 都 与 “一 ” 比 对 。 

Ay RRD, by, os b 都 与 “一 ” 比 对 。 

A; nj thas 一 ) 表 示 a; 与 “一 ” 比 对 ， 需要 在 ww Q, U, ab ba, s 已 间 找到 一 个 
最 优 比 对 。 

Aimi, ji + f (a;, b) 表 示 ai 与 5) 比 对 ， 需要 在 4a!/，as，…， a;b, by, tn, b,_ lA FRE — A 
优 比 对 。 

Å; j1 +f(-, b) 表 示 bj 与 “—” 比 对 ， 需要 在 ai， a2, y a;45b,, by, mts b, fale EB) — A 
最 优 比 对 。 

对 A =abdad 和 B =bacd 使 用 上 面 的 递归 公式 得 到 的 4; 列 于 表 7-3 中 。 

在 表 7-3 中 记录 了 怎样 得 到 每 个 A; j Ma, bE b- PARR bA. Mla, 
p) 到 (a;;，5) 的 箭头 表示 4 与 “一 ” 相 比 对 。 从 (a:，5) 到 (a;，bj-1) 的 箭头 表示 5 与 “一” 相 比 对 。 
基于 表 中 的 箭头 ， 可 以 追溯 找到 最 优 比 对 是 : 

abdad 

一 Pacd 
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现在 芳 虑 另 一 个 例子 。 令 两 个 序列 是 4 =abcd 和 B=cbd。 表 7-4 表 示 Ai 如何 找 出 。 


表 7-3 对 A=abdad 和 8B=bacd 得 到 的 Ai 的 值 




















基于 表 7-4 的 箭头 ， 可 以 追溯 并 得 到 其 最 优 比 对 为 

abcd 

cb-d 

序列 比 对 可 以 看 成 测量 两 个 序列 相似 性 的 方法 。 下 面 给 出 一 个 称 为 编辑 距离 的 概念 ， 它 也 
经 常 可 以 用 来 测量 两 个 序列 的 相似 性 。 

考虑 两 个 序列 4 = aay a, IB = b,b,…b,。 可 以 通过 下 面 三 个 编辑 操作 (edit operation) 将 
A 转换 成 8， 从 4 中 删除 一 个 字符 ， 向 4 中 插入 一 个 字符 ， 用 另 一 个 字符 代替 4 中 的 一 个 字符 。 例 
如 ， 令 A = GTAAHTY，B = TAHHYC。A4 可 以 通过 下 面 的 操作 转换 成 B: 

(1) 删除 4 的 第 一 个 字符 G， 序 列 4 变 成 4 = TAAHTY, 

(2) 用 AH 替代 4 的 第 三 个 字符 4， 序 列 A 变 成 4 = TAHHTY, 

(3) 从 A 中 删除 A 的 第 五 个 字符 T， 序 列 A 变 成 4 = TAHHY, 

(4) 在 4 的 最 后 一 个 字符 后 插入 C， 序 列 4 变 成 4 = TAHHYC， 它 与 8 相同 。 

可 以 给 每 个 操作 分 配 一 个 代价 。 编 辑 距离 (edit distance) 是 把 序列 4 转换 成 序列 B 所 需 的 
编辑 操作 的 最 小 代价 。 如 果 对 每 个 操作 的 代价 是 1， 则 编辑 距离 是 将 4 转换 成 3 的 编辑 操作 的 最 
小 数目 。 在 上 面 的 例子 中 ， 如 果 每 个 操作 的 代价 是 1，A 和 B 间 的 编辑 距离 为 4， 那 么 至 少 需要 4 
次 编辑 操作 。 

显然 ， 编 辑 距离 可 以 用 动态 规划 方法 得 到 。 与 寻找 最 大 公共 子 序列 或 两 个 序列 间 的 最 优 比 
对 的 递归 公式 相似 ， 其 递归 公式 可 以 轻松 得 到 。 令 a、B 和 7 分 别 表 示 插 入 、 删 除 和 替代 的 代价 ， 
A, 表示 aia,…ai 与 bb,…b 间 的 编辑 距离 ， 那么 A; ;可 以 表示 如 下 : 

l 4oo=0 
A; o= ip 
Ao j= ja 
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Aaj 如 果 @a =b, 
A = AtB 
‘J ]min Åj +y 其 他 
a,,,+@ 


实际 上 ， 可 以 很 容易 地 看 出 ， 寻 找 编辑 距离 问题 与 最 优 比 对 问题 是 等 价 的 。 在 这 里 并 不 想 
给 出 一 个 形式 化 的 证 明 ， 因 为 这 可 以 从 对 应 的 递归 公式 的 相似 性 中 得 到 。 相 反 ， 使 用 上 面 的 例 
子 来 说 明 这 一 观点 。 

再 次 考虑 4 = GTAAHTY 和 B = TAHHYC， 产 生 最 优 比 对 如 下 : 

GTAAHTY-— 

—~TAHH-YC 

对 上 面 比 对 的 验证 表明 编辑 操作 与 比 对 操作 的 等 价 性 如 下 : 

(1) 在 比 对 寻找 中 的 (a;,，5) 与 在 编辑 距离 的 寻找 中 的 替代 操作 是 等 价 的 。 在 这 种 情况 下 用 4, 
代替 ai,。 

(2) 在 比 对 寻找 中 的 (a;， 一 ) 与 在 编辑 距离 的 寻找 中 删除 4 中 的 a 是 等 价 的 。 

(3) 在 比 对 寻找 中 的 (一 ，b) 与 在 编辑 距离 的 寻找 中 将 bj 桂 入 4 中 是 等 价 的 。 

读者 可 以 用 上 面 得 到 的 规则 和 最 优 比 对 来 产生 这 三 种 编辑 操作 。 对 于 两 个 已 知 的 序列 A = 
aa…an 和 有 B = bib,…b,， 需 要 一 个 具有 (n + 1)(m + 1) 项 的 表格 来 记录 A4, ;。 就 是 说 ， 对 于 两 个 序 
列 4 = aaya, FNB = bb,…b,， 找 到 最 优 比 对 需要 花费 的 时 间 是 OCnm)。 


7.4 RNA 最 大 碱 基 对 匹配 问题 


核糖 核酸 (RNA) 是 一 种 由 核 苷 酸 ( 碱 基 ) RUM (A), SRM (G), kge (C) FUR 
mene (U) 构成 的 单线 结构 。 碱 基 A、G、C 和 0 的 序列 称 为 RNA 的 基本 结构 (primary structure), 
在 RNA 中 ，G 和 C 能 够 通过 一 个 三 氛 键 构成 一 个 碱 基 对 G 三 C，A 和 U 能 够 通过 一 个 二 毛 键 构成 一 
个 碱 基 对 4 = U，G 和 U 能 够 通过 一 个 单 氨 键 构成 一 个 碱 基 对 GU。 由 于 这 些 氨 键 ，RNA 的 基本 
结构 可 以 在 自身 折 释 形成 其 次 级 结构 (secondary structure)。 例 如 ， 假 设 有 下 面 的 RNA 序 列 。 
A-G—G—C-—C—U—-U—C—C—-U 


那么 ， 这 个 序列 可 以 在 自身 折 和 又 形 成 许多 可 能 的 次 级 结构 。 在 图 7-14 中 显示 了 该 序列 可 能 








的 六 个 次 级 结构 。 然 而 ， 本 质 上 只 存在 一 个 on 
次 级 结构 与 RNA 的 序列 相对 应 。 那 么 RNA 序 _C、 S 7 
Fl FIER RAAT AYE? on S F G= U 
根据 热力 学 假说 ，RNA 序 列 实际 的 次 级 S 了 Gru oS 
结构 具有 最 小 自由 能 量 ， 这 将 在 后 面 解释 。 476-6 U-C-C-U A-G-:C-C-U AU 
本 质 上 ， 只 有 稳定 的 结构 才能 够 存在 ， 稳 定 a) b) c) 
的 结构 必定 具有 最 小 自由 能 量 。 在 RNA 的 次 ETU, 
级 结构 中 ， 碱 基 对 会 提高 结构 的 稳定 性 ， 未 ETU, qc oY 
配对 的 碱 基 将 降低 结构 的 稳定 性 。G 三 C 和 A ETU, Cp Gc 
= 1 类 型 的 碱 基 对 ( 称 为 Watson-Crick 碱 基 对 ) CY Gre Ge 
HG—U EI REE ( 称 为 wobble 碱 基 对 ) A~G-G--C-C-U 4-GC 7 AU 
更 稳定 。 根 据 这 些 事实 ， 可 以 发 现 图 7-14f 所 a) 9 D 
示 的 次 级 结构 是 序列 4-G-G-C-C-17 一 CC 图 7-14 RNA 序 列 4-G-G-C-C-U-U-C-C-U 的 六 个 


C-C-U 实 际 的 次 级 结构 。 可 能 的 次 级 结构 (虚线 表示 氨 键 
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-个 RNA 序 列 可 以 用 由 m 个 字符 的 字符 串 R = rrr, dea, Her, © {A, C, G, U}. nl 
典型 范围 是 从 20 到 2000。R 的 次 级 结构 (secondary structure) 是 碱 基 对 (r;,，r)) 的 集合 5， 其 中 1 
i<j<n， 满 足下 面 的 条 件 : 

(1) i >t， 基 中! 是 小 的 正常 量 ， 典 型 的 值 1 = 3。 

(D 如 果 (r;，) 和 (rt，) 是 5 中 的 两 个 碱 基 对 ， 且 i 二 Kk， 那么 

(a) i=k 目 j= 1， 也 就 是 (r;，r)) 和 (rm，r) 是 相同 的 碱 基 对 ， 
(b) i<j<k<l, RAC, ETO. r), RE 
(c) i<k<I<j, HRC, NAA. r) 

 -BMAULZE RRNA IIH RERA SHA, BORA - PARES 
BSP MEM, THAR ARAMA SHEA. WURI<K<I<j, BARAER, KAN, 
门 称 为 庶 结 (pseudoknot) 。 虚 结 确实 在 RNA 分 子 中 存在 ， 但 排除 它们 则 简化 了 问题 。 

对 次 级 结构 预测 的 目的 是 找到 一 个 有 最 小 自由 能 量 的 次 级 结构 。 因 此 ， 必 须 有 一 个 方法 来 
计算 次 级 结构 8 的 自由 能 量 。 因 为 碱 基 对 的 形式 会 对 结构 的 自由 能 量 给 出 稳定 的 影响 ， 测 量 $ 的 
白 由 能 量 最 简单 方法 是 将 能 量 分 配 到 3 的 每 个 碱 基 对 ， 这 时 $ 的 自由 能 量 是 全 部 碱 基 对 能 量 的 总 
和 。 由 于 不 同 的 氮 键 ， 碱 基 对 的 能 量 通常 分 配 不 同 的 值 。 例 如 ，G=C，4 = UMG-UN ARIA 
分 别 为 =-3，-2 和 -1。 其 他 可 能 的 值 是 碱 基 对 的 能 量 全 都 相等 。 在 这 种 情况 下 ， 问 题 变 成 一 个 
寻找 具有 最 大 数量 碱 基 对 的 次 级 结构 。 次 级 结构 预测 问题 的 这 种 说 法 也 称 为 RNA 最 大 破 基 对 匹 
配 问 题 (RNA maximum base pair matching problem) ， 由 于 可 以 把 次 级 结构 看 成 是 一 种 匹配 问 
题 。 接 下 来 ， 引 入 动态 规划 来 解决 RNA 最 大 碱 基 对 匹配 问题 ， 定 义 如 下 : 已 知 一 个 RNA 序 列 R 
= 六 PP 六， 找到 具有 最 大 数目 碱 基 对 的 RNA 次 级 结构 。 

2S, 表示 在 子 串 R，， = rr ,关上 最 大 数目 碱 基 对 的 次 级 结构 ， 用 呆 , ERES, 中 已 匹配 
的 碱 基 对 。 注 意 并 不 是 任何 两 个 碱 基 r, 和 rj 都 能 相互 配对 ， 其 中 1 <i<j<n。 在 这 里 考虑 可 接受 
的 碱 基 对 是 Watson 一 Crick 碱 基 对 (也 就 是 G=C 和 A4 = U) 和 wobble 碱 基 对 (也 就 是 CG 一 [) 。 令 
WW = {(A, U), (U, A), (G, C), (C, G), (G, U), (U, G), BAHAR; RARER 
两 个 碱 基 r; 和 r 是 否 合 理 的 碱 基 对 : 

1 # (rn, EWW 
plr;, r= | 否则 

根据 定义 ， 知 道 RNA 序 列 在 自身 上 不 能 太 剧 烈 地 折合 。 就 是 说 ， 如 果 j 二 i<3， 那 么 ;和 7 就 
不 是 8 的 碱 基 对 。 因 此 ， 如 果 j 二 i<3， 那 么 令 M;. ;= 0。 

要 计算 M，;， 其 中 ji>3。 从 r 的 视角 考虑 下 面 的 情形 。 

情形 1， 在 最 优 解 中 ，r; 与 任何 其 他 碱 基 都 不 匹配 。 在 此 情况 下 ， 找 到 rr; SM, ;= Mi ;1 
的 最 优 解 (参见 图 7-15)。 

情形 2: 在 最 优 解 中 ,rj 与, 配对。 在 此 
情况 下 ， PB, 7; FM, j” 1 + M;,.) t 
的 最 优 解 (参见 图 7-16)。 

情形 3: 在 最 优 解 中 ， 六 与 某 个 r 配 对， 其 
Hi +1<k<j-4, FE, FRB ore 
与 六 六 gM, ;= 1 + AM yy + Mi 的 
最 优 解 (参见 图 7-17)。 S$ 

因为 要 找到 i + 1 与 + 4 间 的 k 使 得 Mi 最 
人 大， 我 们 得 到 图 7-15 情形 1 的 图 示 
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M j= max {Il+ M+ Mj} 


ftbsks 4 











Sig- ~ Sati 


WI6 FEB A (I-17 FBS 


BZ, RA PRU, 的 递归 公式 。 
如 时 ji<3， BAM, = 0。 


Mi js 


kuji >3 5 HAM, i = max a + Maajad x P(r, ,7,) 
max {l + Miia + Marga X POT) 


tek 
根据 上 面 的 公式 ， 可 以 设计 应 用 动态 规划 技术 计算 24， ,的 算 小 7-1。 表 7.S 说 明了 对 Mi 的 
计算 过 程 ， 其 中 1si<j 和 10， 对 于 某 个 RNA 序 列 R， io = 4~G-G~C-C-U-U-C~C-0 的 计算 。 
AFM, = 3， 可 以 找到 9，w 中 碱 基 对 的 最 大 数 是 3。 


7-5 RNA 序 列 A-G-G-C-C-U-U-C-C-U 的 最 大 碱 基 对 数 的 计算 
















\ 2 3 4 3 了 g 9 10 
Í 8 D 0 0 0 1 2 2 2 3 
2 — D Q 0 9 ! i 2 2 2 
3 一 一 0 0 9 q l t i ! 
4 一 - ~ ô D 0 Q 0 D 0 
5 一 一 一 一 0 0 6 0 0 D 
6 一 一 一 -一 一 0 0 0 0 0 
7 一 一 一 -一 一 一 0 0 0 0 
8 一 一 - 一 一 -一 一 一 0 Q 9 
9 一 一 一 一 0 0 
10 一 一 0 












算法 7-{ RNABARBH EMRE 


输入 : RNA 施 列 R = rirz hao 
Sy HENS SA GRIER MIRNA REI. 
$M PLSS, IRB, 只 的 值 */ 
wwelia, VU), U, A, (G, ©), (C. G}, (C, U) WU, Os 
for (= Í ton do 
forj =i ton do 
ifin DEWW then plr,, r) =t; else pir, r) =O; 
end for 
end for 
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P2. AM Pi 3, WEM, */ 


for i= 1 to n do 
for j=itoi+3do 
if j<n then M, ,= 0; 
end for 
end for 
步骤 3. /+ 对 十 ji >3, LPM, | */ 
forh=4ton-l do 
for i= | to n—h do 
j=i+h; 
casel =M 
cased = (1+ Mi, D X pli, r)s 


we 


case3 = M,, imax Ad + Mirat Meaga) x PD} 
bbe hej 


M; ,= max{casel, case2, case3}, 
end for 
end for 


现在 给 出 整个 过 程 的 详细 说 明 。 
r, ry r; ra rs re r rs ro 
A G G C C U U C C 
(=1，7=S，prr)=p4C)=0 

M,, 

(1+ M, 4) p(y, 45) 

= max{0, 0} =0, 


(2) i= 2,7 =6, pr re) = p(G, U) = 1 


Ad ;= max 


M, ¿= max Ms 
aan (I+ M;s)x pP, r) 
= max{0, (1 + 0) x 1} = max{0, I} =1, 
r,5r,4H DC Ad. 
(3) i=3,7=7, prs, 1) = p(G, U) = 1 
M, -= max *6 
aT (1+ M6)x Pr) 
= max{0, (1 + 0) x 1} = max{0, 1}= 1。 
r,45r,4H UC AC. 
(4)i=4, 7 =8, plrs, rg) = p(C, C) =0 
Ms 
M, g = made May) x ptr 


= max{0, (1 +0) x 1} =0, 
(5)i=5,j=9, p(rs, ro) = p(C, C) = 0 


M; ,= max Mss 
59 (L+ Mog) x plrs,n) 


Fio 
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= max{0, (1 + 0) x 1} = max{0, 0} =0, 
(6) i= 6, 7 = 10, p(ro rio) = ECU, U) =0 
M, 
Ms, io = max “° 
, (1+ M;,)x Pho) 
= max{0, (1 + 0) x 0} = max{0, 0} =0, 
(7)i=1,j=6, pry, re) = p(A, U)=1 
Mis 
M, = max: (l+ M,5)x P(n, r) 
(1+ Mi, + M,s) x P(r) 
= max{0, (1 +0)x1,(l+0+0)x1}=max{0, I, 1} =1, 
与 re 相 匹 配 。 
(8)i=2,7=7, pn re) = p(G, U)=1 
M,,, 
M,,= maxi(1+M,.)x POr) 
(+M, + M,6)x Pr) 
= max{1, (1 +0)x1,(1+0+0)x1}= max{1,1,1}=1, 
r,457,40 PLAC. 
(9) i=3,j=8, prs, rs) = p(G, C)=1 
M,, 
M; = max (1+ M,,)x PC, R) 
(1+M,,+M,,)x Pln) 
= max{1, (1 +0) 1,(1+0+40) x0} = max{1, 1,0}=1, 
六 与 rs 相 匹 配 。 
(10) i=4, 7 =9, plra ro) = p(C, C) = 0 
M,s 
Ma9 = max (1+ M;s)x Ph) 
(1+ M, 4 + Mss) x P(%,%) 
= max{0, (1 + 0) x0, (1 + 0 + 0) x 0} = max{0, 0, 0} =0, 
(11) i =5, f= 10, p(rs, ro) = p(C,C)=0 
Mz. 
Ms \) = max (1+ Moo) x plrs,1i0) 
(1+ M,,+M,,)x PUT. >To) 
= max{0, (1 + 0) x0, (1 +0 + 0) x 0} = max{0, 0, 0} =0, 
(12)i=1,/=7, ply, 7) = p(A, U) = 1 
M 


M, ;= max (1+ M, 6) x PCr) 
` (1+ M, + Me) x POr) 


(1+M,, +M46)X P(T) 
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= max{l,(1 +1) 1,(1+0+0)x 1, (1 +0+0) }} =max{!,2, 1,1} =2, 
(3)i=1,7=8, Pra» rs) = p(G, C) = | 
M,, 
(1+M,,)x p, r) 
YIG +M, +My 5)x Ph) 
d +M: + M;3)x P) 


M, s = ma 


= max{1,(1 +1)x1,(1+0+0)x 1, (1 +0 +0) x 0} = max{1, 2, 1,0} =2, 
rs ‘Sr, AHPCACs 与; 相 匹 配 。 
(14) i= 3,j=9, Pfa ro) = p(G, C)=1 
My. 
(1+ Ms)} x p(n,n) 
(1+ M; + M;g)X plist) 
(1+ My, + Mag) X Psr) 


M, ,= max 


=max{1l,(1+0)x1,(1+0=+0)x0,(1 +0+0) x0} = max{1, 1,0,0}=1, 


r SrtA Cad. 
(15) 1=4, 7 = 10, pra, mo = p(C, U) = 0 
Ms 
(1+ Mso)x PO no) 
M; w= 


max 
(d+ Mia + Meo) x Pro) 


(1+ Ms + M,,)x Pho) 


max{0, (1 +0) x0, (1 +0 +0) x0, (1 +0 +0) x 0} 
= max{0, 0, 0,0} =0, 
(16) i= 1,7 = 8, pr, rg) = p(A, C) = 0 
M,, 
(1+ M,;)x p(n,n) 
Ms = max (1+M,,+M,,)* p(y") 
(1+M,,+M,,)* PO) 
(1+ M,,+ Ms;,)x Plast) 
= max{2, (1+ 1) x0,(1+04 1) 1,(1 +040) 1, (1 +040) x0} 
= max{2,0, |, 1,0} =2, 
rr 40ER, 7 与 re 相 匹配 。 
(17) §= 2,7 =9, Pro ro) = p(G, C) = I 
M,» 
(1+ Ms) x pln,n) 
M,, = max} (l + M, + Mas) X POTo) 
(+A1 + M:r) X PTa) 
(1+ M, 4 + Meg) X PCs) 
= max{2, (1+ 1)x1,(1 +040) 1, (1+040)x0, (14+0+40)x0} 
= max{2, 2, 1, 0, 0} = 2。 
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1 与 1o 相 匹配 ， 7 与 7 相 匹 配 。 
(18)i= 3, 7 = 10, p(r3, rio) = p(G, U) = 1 
M; o 
(1+ Mo) x p(y. No) 
M, io = max (1+ M,, + Mo) x Pgno) 
(1+ My. + Moo) x plrs, no) 
(1+ M;s + Ms) x pltsto) 


= max{1,(1+0)x1,(1+0+0)x0,(1+0+0)x0,(1+0+0) x0} 
= max{1,1,0,0,0}=1, 


;与 rio 相 匹配 。 
(d9)i=1,j=9, pr, r) =pA, C) =0 
Ms 
(+ M,,) x Pr) 


(1+ M,,+M,.) x p(n,,n) 
(+M,.+M,,)x p(n,n) 
(1+ Mi + M55) x pln, ns) 
(L+ M4 + Mo.) * PCr) 


M, = max 


= max{2, (1 +2)x0,(1+0+1)x1,(1+0+0)x1,(1+0+0)x0,(1+0+0)x0} 
= max{2, 0, 1, 1,0,0} =2, 
r 5r4H0C Ad; nr AAA. 
(20) i= 2, j= 10, P(r}, rio) = p(G, U) = 1 
Mo 
(+ M;,) x Pro) 
(1+ M,, + Mao) x Pro) 
(1+ M,, + Myo) Pno) 
(1+ M, + Moo) * Pro) 
(1+ M,,+M,,)x PU No) 
= max{2, 2, 1, 1,0,0} = 2。 
ror oH E Ae; ;与 ro 相 匹 配 。 
(21)i=1,j= 10, P(r rio) = pA, U) = 1 
Mis 
(1+ M,o)x pln,rno) 
(L+ M+ M3o)x plr No) 
M, 1 = max{ (1+ M,a + Myo) Pl,no) 
(+M; +M55)* pln, rio) 
(1+ M4 + Moo) x plrs, ño) 
(1+ Ms +My 5) Plasto) 
= max{2, 3, 2, 1, 0, 0,0} = 3, 
与 rio 相 匹配 ，r2 与 ro 相 匹 配 ， 7 与 rs 相 匹 配 。 


M, io = max 
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搂 下 来 ， 分 析 算法 7-1 的 时 间 复杂 度 。 步 又 1 的 代价 很 明显 是 O(a)。 对 于 步 又 2， 至 多 
有 史 》'， 次 选 代 ， 每 次 选 代 都 花费 00- 站 的 时 间 。 因 此 ， 步 晴 2 的 代价 是 


J. ou-n=om 


因此 ， 算 法 7-1 的 总 时 间 复杂 度 是 On。 
75 _ 0/ 背包 问题 


0/1 背 包 问 题 (0/1 knapsack problem) 已 经 在 第 6 章 中 讨论 过 。 在 本 节 中 ， 说 明 此 问题 可 以 
用 动态 规划 方法 轻松 地 求解 。0/1 背包 问 题 定义 如 下 : 已 知 有 7 个 物体 和 一 个 背包 ， 物 体 ;的 重量 
为 Wi， 背 包 的 容量 为 M。 如 果 物 体 ; 放 入 背包 中 ， 那 么 可 获得 的 利润 为 P,。0/1 背 包 问 题 是 在 所 
选择 的 所 有 物体 总 重量 不 超过 M 的 条 件 下 ， 获 得 最 大 的 总 利润 。 

需要 采取 -系列 的 行动 。 令 X 为 变量 ， 表 示 物 体 i 是 否 被 选择 。 就 是 说 ， 如 果 物 体 i 被 选择 ， 
那么 令 X; = 1, BMAX, = 0。 如 果 X, 赋 值 为 1 (物体 1 被 选择 )， 那 么 剩 下 的 问题 变 成 修正 的 0/1 
背包 问题 ， 其 中 MM 变 成 MW,。 通 常 ， 在 做 出 了 X!，X,，…， XX 表示 的 决策 序列 后 ， 问 题 简化 为 


包含 决策 X,, |， Xira ty XMM = M- Ș X,W, 的 问题 。 因此 ， 无 论 决策 Xi， Xa, ey X 是 什 


么 ， 剩余 的 决策 X; ,，， Xian a) X, 必 须 关 于 新 的 背包 问题 表 7-6 三 个 物体 的 重量 和 利润 
是 最 优 的 。 下 面 说 明 0/1 背 包 问 题 可 以 用 多 阶段 图 问题 来 表 一 一 一 





示 。 假 设 有 三 个 物体 和 一 个 容量 为 10 的 背包 。 这 些 物体 的 重 — 2 
量 和 利润 如 表 7-6 所 示 。 2 3 20 
用 动态 规划 方法 解决 这 个 0/1 背 包 问 题 可 以 用 图 7-18 来 。 3 5 30 


说 明 。 





图 7-18 用 动态 规划 方法 来 解决 0[1 缘 包 辣 题 


在 每 个 结 点 中 ， 有 标签 来 标记 一 直到 该 点 已 经 做 出 的 决策 。 例 如 ，011 意 味 着 X = 0，X, = 
1 和 X, = 1。 在 这 种 情况 下 ， 我 们 对 最 长 路 径 感 兴趣 ， 很 明显 ， 最 长 路 径 是 3 一 0 一 01 一 011 一 了 ， 
对 应 于 

X,=0, 

X,=1, 
和 X,=1 
总 的 代价 等 于 20 + 30 = 50, 
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76 最 优 二 叉 树 问题 


二 义 树 (binary tree) 可 能 是 最 常见 的 数据 结构 之 一 。 已 知 n 个 标识 符 a/<as<…<a,， 可 以 
有 许多 不 同 的 二 又 树 。 例 如 ， 假 设 有 四 个 标识 符 3，7，9 和 12。 图 7-19 列 出 了 对 于 这 个 数据 集 
的 四 棵 不 同 二 又 树 。 





a) b) c) d) 
图 7-19 对 于 则 一 个 数据 集 的 四 棵 不 同 二 又 树 


对 于 给 定 的 二 叉 树 ， 与 经 过 多 步 检 索 才 能 找到 存储 在 远离 树 根 的 数据 相 比 ， 存 储 在 离 树 根 
较 近 的 标识 符 能 更 快 得 到 检索 。 对 于 每 个 标识 符 w;， 添 加 一 个 概率 已 ， 它 是 这 个 标识 符 能 够 搜 
索 到 的 概率 。 对 于 没有 存储 在 树 中 的 标识 符 ， 假 设 也 有 分 配给 它 的 概率 。 将 不 在 树 中 的 数据 划 
分 成 n + 1 个 等 价 类 。 定 义 Q 为 检索 X 的 概率 ， 基 中 a; <X<w , ,， 并 假设 ao 是 -2%，a, :是 +tc2。 概 
率 满足 下 面 的 等 式 : 

dF + > =1 


很 容易 确定 成 功 检 索 需 要 的 步 数 。 令 Za) 表示 ai 存储 在 二 叉 树 的 层次 。 如 果 令 树 根 在 第 1 层 ， 
那么 检索 a 需要 L(a)) 步 。 对 于 不 成 功 的 搜索 ， 最 好 的 理解 方法 是 在 二 又 树 上 添加 外 部 结 点 。 现 
在 考虑 具有 标识 符 4，$，8，10，11，12 和 14 的 情况 。 对 于 这 个 数据 集 ， 将 划分 整个 区 域 如 下 : 

4, 5, 8, 10, H, 12, 14 


E E, E E E E E E 


假设 有 如 图 7-20 所 示 的 二 叉 树 。 在 这 棵 二 又 树 中 ， 有 些 结 点 不 含 两 个 子孙 结 点 。 不 成 功 的 
检索 通常 发 生 在 这 些 结 点 上 。 可 以 在 树 上 加 上 用 方 框 表示 的 虚拟 的 结 点 ， 如 图 7-21 所 示 。 








图 7-20 二 叉 树 图 7-21 添加 了 外 部 结 点 的 二 又 树 
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所 有 其 他 结 点 称 为 内 部 结 点 (internal node), XERRA ARRAI A (external 
node) 。 不 成 功 的 检索 总 是 终止 在 这 些 外 部 结 点 上 ， 而 成 功 检索 终止 在 内 部 结 点 上 。 
在 漆 加 了 外 部 结 点 后 ， 二 叉 树 期 望 的 代价 值 可 以 表示 如 下 : 


$ Pla, + Soe) -D 


最 优 CLH} (optimal binary tree) 是 上 式 代价 值 最 小 的 一 又 树 。 应 注意 通过 穷尽 检测 全 部 

可 能 的 一 义 树 来 解决 最 优 二 又 树 问题 是 相当 耗费 时 间 的 。 已 知 "个 标识 符 ， 用 这 n 个 标识 符 构造 
2 

的 全 部 可 能 的 相 异 二 又 树 的 数目 是 ail ,| HEWN), 


n+l 

为 什么 可 以 用 动态 规划 方法 来 解决 最 优 二 又 树 问 题 昵 ”找到 最 优 二 又 树 关键 的 第 一 步 是 选 
FR 个 标识 符 作为 树 根 ， 比 如 是 w。 在 选择 好 as 后 ， 全 部 小 
Fw 的 标识 符 构 造 为 w 的 左 后 代 ， 全 部 大 于 w 的 标识 符 构造 (a ) 
在 的 右 后 代 ， 如 图 7-22 所 示 。 

我 们 不 能 简单 地 确定 应 该 选择 哪个 a 作为 根 ， 需 要 检 
查 全 部 可 能 的 a,。 然 而 ， 一 旦 a 被 选 定 ， 注 意 到 子 树 L 和 R AN /\ 
- 定 也 是 最 优 的 。 也 就 是 ， 在 w 选 定之 后 ， 我 们 的 工作 简 
化 为 找到 比 w 小 的 标识 符 和 比 ww 大 的 标识 符 的 最 优 二 又 树 。 
可 以 递归 地 解决 该 问题 表明 可 以 使 用 动态 规划 方法 。 

为 什么 动态 规划 方法 适用 于 找到 最 优 二 叉 树 ? 首先 ， 该 方法 给 了 我 们 一 个 系统 化 的 思考 方 
法 。 为 了 说 明 这 点 ， 假 设 有 五 个 标识 符 : 1，2，3，4 和 5。 假 设 3 选 作 为 树 根 ， 如 图 7-23 所 示 ， 
左 子 树 包含 1 和 2， 右 子 树 包含 4 和 5。 


图 7-22 在 选择 a, 作 为 根 后 的 二 又 树 


F-- 步 要 分 别 找到 对 1 和 2 及 4 和 5 的 最 优 二 又 树 。 对 于 Cs) 

包含 1 和 2 的 二 叉 树 ， 选 作 根 只 有 两 种 选择 ，! 或 者 2。 对 于 

包含 4 和 5 的 二 又 树 也 同样 。 换 句 话说 ， 以 3 作为 根 的 最 优 

二 又 树 由 下 面 的 四 棵 子 树 确定 ; /A AN 
(a) 包含 1 和 2 上 且 以 1 为 根 的 子 树 。 和 
(b) 包含 1 和 2 且 以 2 为 根 的 子 树 。 图 7-23 以 特定 标识 符 选 为 根 的 二 又 树 


(c) 包含 4 和 5 且 以 4 为 根 的 子 树 。 

(d) 包含 4 和 5 且 以 5 为 根 的 子 树 。 

左 子 树 为 (a) 或 者 为 (b)， 右 子 树 为 (c) 或 者 为 (d)。 

现在 汐 虑 选择 2 为 根 的 情况 。 此 时 ， 左 子 树 只 包含 一 个 标识 符 1。 右 子 树 包含 三 个 标识 符 : 
3，4 和 5。 对 于 此 右 子 树 ， 必 须 考 虑 三 种 子 情况 ， 选 择 3 为 根 ， 选 择 4 为 根 和 选择 5 为 根 。 我 们 主 
要 关心 选择 3 为 根 的 情况 。 如 果 选 择 3， 那 么 其 右 子 树 包含 4 和 5。 就 是 说 ， 对 包含 4 和 5 的 子 树 而 
论 ， 还 要 检查 应 该 选择 4 或 哪个 为 根 。 这 样 我 们 断定 ， 为 了 找到 以 2 为 根 的 最 优 二 又 树 ， 在 其 
他 子 树 中 要 检查 下 面 的 两 棵 树 : 

(e) 包含 4 和 5 且 以 4 为 根 的 子 树 。 

O 包含 4 和 5 且 以 5 为 根 的 子 树 。 

很 明显 ，(c) 与 (e) Sr, A (d) 与 (f) 等 价 。 这 意味 着 ， 找 到 以 3 为 根 的 最 优 二 又 树 
的 方法 ， 对 于 找到 以 2 为 根 的 最 优 二 又 树 也 是 同样 有 效 的 。 同 理 ， 我 们 看 到 要 找到 以 4 为 根 的 最 
优 一 又 树 ， 需 要 找到 包含 1 和 2 的 以 1 或 2 为 根 的 最 优 二 叉 树 。 正 如 前 面 指出 的 那样 ， 这 项 工作 和 需 
要 找到 以 3 为 根 的 最 优 二 又 树 。 

总 之 ， 我 们 注意 到 ， 已 知 w，a，…， 四 ， 要 找到 以 a 为 根 的 最 优 二 又 树 的 工作 ， 同 样 在 找 
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到 以 a 为 根 的 最 优 二 又 树 也 需要 。 这 一 原理 可 用 到 任何 层次 的 所 有 子 树 上 。 因 此 ， 动 态 规划 能 
够 通过 自 底 向 上 方法 解决 最 优 二 又 树 问题 。 也 就 是 说 ， 从 构建 较 小 的 最 优 二 又 树 开始 。 应 用 这 
些小 的 最 优 二 叉 树 来 构建 越 来 越 大 的 最 优 二 又 树 。 当 找到 包含 全 部 标识 符 的 最 优 二 又 树 时 ， 就 
达到 了 我 们 的 目标 。 

为 了 更 明确 些 ， 假 设 要 找到 含有 四 个 标识 符 ，1，2，3 和 4 的 最 优 二 叉 树 。 用 记号 (at，ai 一 
ARRAS Ma Blaha AVE WH. Fla, 一 4) 表 示 包 含 从 a; 到 a 的 标识 符 的 最 优 二 又 
树 。 找 出 包含 1，2，3 和 4 的 最 优 二 又 树 的 动态 规划 过 程 描 述 如 下 : 

(1) 开始 时 找 出 

(1, 1-2) 
(2, 12) 
(2, 2-3) 
(3, 2-3) 
3, 3-4) 
(4, 3-4) 
(2) 应 用 上 面 的 结果 ， 确 定 
(一 2)( 由 (1，1 一 2 和 (2，!1 一 2) 确 定 ) 
(2 一 3) 
(3 一 4) 
(3) 然后 寻找 
(1，1 一 3)( 由 (2 一 3) 确 定 ) 
(2，1 一 3) 
(3, 1-3) 
(2, 2-4) 
(3, 2-4) 
(4, 2-4) 
(4) 应 用 上 面 的 结果 ， 确 定 
(1 一 3)( 由 (1 ，1 一 3)，(2，1 一 3) 和 (3，1 一 3) 确 定 ) 
(2 一 4) 
(5) 然后 找 出 
(1，! 一 4)( 由 (2 一 人 4) 确定) 
(2，1 一 4) 
(3，1 一 4) 
(4，1 一 4) 
(6) 最后， 确定 
(1 一 4) 
因为 它 由 下 面 几 项 决定 : 
a, 1-4 
(2, 1-4) 
(3, 1-4) 
(4, 1-4), 

二 面 四 棵 具有 最 小 代价 的 二 又 树 中 任何 一 棵 都 是 最 优 的 。 

读者 能 够 看 出 动态 规划 是 解决 最 优 二 又 树 问题 的 有 效 方 法 。 它 不 仅 提供 了 系统 的 思考 方法 ， 
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在 描述 了 用 动态 规划 方法 解决 最 优 二 又 树 问题 的 基本 原理 后 ， 现 在 给 出 精确 的 原理 。 因 为 
对 最 优 二 又 树 的 检索 由 查找 许多 最 优 二 叉 树 构成 ， 这 里 只 简单 考虑 检索 任意 子 树 的 通常 情形 。 
想象 已 知 -系列 标识 符 Q,，a;，…，a,， 且 a 是 其 中 之 一 。 如 果 选 择 a 为 二 又 树 的 根 ， 那 么 左 
(RE) 子 树 将 包含 金 部 标识 符 @l，…，axi(ae ,1，…， ap 此 外 ， 检 索 w 需 要 一 步 ， 所 以 其 他 
的 成 功 搜索 需要 1 加 上 需要 搜索 左 或 右 子 树 的 步 数 ， 这 对 于 不 成 功 的 检索 同样 适用 。 

Ci, 有 ) 表 示 包 含 4 到 a 的 最 优 二 又 树 代 价 ， 那 么 以 qi 为 根 的 最 优 二 又 树 具有 下 面 的 代价 


Q, + Serr "| [once 


其 中 P. 是 检索 根 的 代价 ， 第 二 项 和 第 三 项 分 别 是 检索 左 子 树 和 右 子 树 的 代价 。 上 面 的 公式 可 以 
得 到 如 下 任意 的 Cti, J): 


C(l,n)= maz + 








kl j 
Ci, j) = nin +|Q + de :Ooxcot- 路 fe + de +Q,)+Clk+ 可 
SANS = [ye 


= mofeuk-Ds cesis XG rej 


例如 ， 如 果 有 四 个 标识 符 a/，a;，a; 和 as， 目 标 是 找到 C(1，4)。 由 于 对 十 根 有 四 种 选择 

能 , 需要 计算 四 棵 最 优 子 树 的 代价 ,C(2, 4) (以 a 为 根 )， PRN 

C3, 4) (以 gy 为 根 )，C(1，2) (以 a; 为 根 ) MCU, 3) 

(以 q 为 根 )。 要 计算 C(2，4)， 需 要 计算 C(3，4) (La, 

为 根 ) 和 CC(2，3)( 以 as 为 根 )。 要 计算 C(1，3)， 需 要 计 K A 

算 C(2，3) (Dla, WH) FICC, 2) (以 a; 为 根 )。 它 们 的 

关系 在 图 7-24 进 行 说 明 。 ca, 一 \, / SN 4) 
总 之 ， 给 定 n 个 标识 符 来 计算 C(1，n)， 需 要 首先 计 本 

算 所 有 广 ; = 1 的 C(i， De TK, WBRA- = 2 的 图 7724 子 树 间 的 计算 关系 

Ci, 让 ， 然 后 所 有 ji = 3 的 C(i， 站， 等 等 。 现 在 检验 此 过 程 的 复杂 度 。 计 算 过 程 需 要 计算 对 于 

ji = 1，2，…，n 一 1 的 C(i, De “j-i = mit, Aam ACi, De BKC, 的 计算 都 需 

要 找到 m 个 数量 的 最 小 值 。 因 此 ， 每 个 具有 ji = m 的 C(i，)) 都 能 够 在 O(m) 时 间 内 计算 得 到 。 计 

算 所 有 ji= m 个 C(i,， 有 的 总 时 间 是 OCmn 一 rr)。 因 此 ， 用 动态 规划 方法 解决 最 优 二 又 查找 树 问 

大 的 总 时 间 复杂 度 是 0 Zom-m) = oo 


Iams 


7.7 树 的 带 权 完全 支配 问题 


在 带 权 的 完全 支配 问题 (weighted perfect al B 16 
domination problem) 问题 中 ， 已 知 图 G = (VY，E)， 其 中 G) © Go 
每 个 顶点 v E V 有 代价 c(v)， 每 条 边 e E E 有 代价 c(e)。 图 11 41 
G 的 完全 支配 集 (perfect dominating set) 是 顶点 集 V 的 

子 集 D， 使 得 每 个 不 在 PD 中 的 顶点 恰好 邻接 于 D 中 的 一 
个 顶点 。 如 果 v 不 属于 DD，u 属 于 D，(n，v) 为 E 中 的 边 ， © Ca) 
那么 完全 支配 集 D 的 代价 包含 D 中 全 部 点 的 代价 和 ct(u， 


Shae 4 4 A >H H \ 代 Aye 
emi 带 权 的 完全 支配 是 要 找 出 具有 最 小 代价 的 完 2S RRDA KREDE 


15 
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参见 图 7-25。 有 许多 完全 支配 集 。 
例如 ，D, = {v n, VEZME, DIRNE 
c(v,) + elva) + c(y5) + C(V3, V2) + €(¥4, V5) 
=414+13+ 1646415 
=91 
另 一 个 例子 是 DP = {v vs}, DARNE 
C(V2) + cvs) + COV, V2) + C(V35, V2) + elva, vs) 
=13+16+114+6+415 
= 6] 
最 后 ， 令 Di = {v v3, va, Vs}, DARME 
C(V2) + c(v3) + c(v4) + CVs) + (VY), v2) 
=134+414+4+16+11 
= 45 
可 以 证 明 ，D; 是 最 小 代价 完全 支配 集 。 
带 权 的 完全 支配 问题 对 于 二 分 图 和 纺 图 都 是 NP 难 的。 但 我 们 将 说 明 应 用 动态 规划 方法 能 
够 解决 树 的 带 权 完 全 支配 问题 。 
应 用 动态 规划 策略 的 主要 工作 是 合并 两 个 可 行 解 为 一 个 新 的 可 行 解 。 现 在 通过 一 个 例子 来 
说 明 这 种 合并 ， 参 见 图 7-26。 在 图 7-26 中 ， 有 两 个 图 G, 和 6G，， 它们 将 通过 连接 G, 中 的 v,/ 和 G, 中 
的 ve 合并 成 G。 





图 7-26 一 个 说 明 解决 带 权 完全 支配 问题 合并 方法 的 例子 


通过 连接 Gi 中 的 v, 和 Gs 中 的 ve 将 G1, 和 G, 组 合 到 一 起 ， 可 以 考虑 将 v, 作 为 G1 的 根 ， 将 vo 作为 
G; 的 根 。 现 在 考虑 六 个 完全 支配 集 : 

Dy = {v v2, v}, Da = {Ver v7, Ve} 

Dy. = {¥3, Va}, Dy, = {v7, Yio} 

Dy; = {Vay Vs}, D,; = {vo, Vio? 

FAG (G) HRY VE PP , D (Dy) G (Gy) HITCH X BLE 

在 图 G(G2) 的 根 w(vo) 未 包含 其 中 的 情况 下 ， Dia(D2) 是 G1(G,) 的 完全 支配 集 。 

在 vi(vo 中 没有 邻居 包含 其 中 的 情况 下 ，Dw(Dz3) 是 G1 一 {v1}(Gs 一 ty6)) 的 完全 支配 集 。 

现在 通过 合并 上 面 G, 和 G; 的 完全 支配 集 来 产生 G 的 完全 支配 集 。 

(1) DUD; = {Yi, Vz, Vax Ves Vys Ve} 是 G 的 完全 支配 集 ， 其 代价 是 Di 与 Dz 的 代价 和 ， 这 
个 完全 支配 集 包 含 w 和 ve。 

(2) D UDa = {W，m，m，w，v9j 是 G 的 完全 支配 集 ， 其 代价 是 Di 与 D2 的 代价 加 上 连接 " 
和 v6 的 边 的 代价 和 ， 这 个 完全 支配 集 包 含 v,， 但 不 包含 ve。 
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(3) DUDy = {yy，V4， Wy， Vo} 是 G 的 完全 支配 集 ， 其 代价 是 D1, 与 Dy 的 代价 和 ， 这 个 完全 
支配 集 不 包含 v, 和 v6。 

(4) D, UD, = {vas Vs, Ves Vas vs} 是 G 的 完全 支配 集 ， 其 代价 是 D1; 与 Dy 的 代价 加 上 连接 v， 
和 ve 的 边 的 代价 和 ， 这 个 完全 支配 集 不 包含 w， 但 包含 w。 

上 面 的 讨论 描述 了 应 用 动态 规划 方法 解决 带 权 完全 支配 问题 的 策略 基础 。 

下 面 首先 假设 图 是 以 某 点 为 根 的 ， 且 当 合 并 两 个 图 时 ， 连 接 两 个 根 。 

进行 下 面 的 定义 : 

D(G, u): 在 完全 支配 集 包 含 的 情况 下 ， 图 G 的 最 优 完全 支配 集 。D1(G，w) 的 代价 表示 为 
ô, (G, u), 

DAG, u): 在 完全 支配 集 不 包含 4 的 情况 下 ， 图 G 的 最 优 完全 支配 集 。D,(G，w) 的 代价 表示 
为 6, (G, u), 

DAG, u): 在 图 G 一 {4} 的 完全 支配 集 不 包含 u 的 任何 邻接 点 的 情况 下 ， 图 G 一 {4} 的 最 优 完 
全 支配 集 。D;(G，ww) 的 代价 表示 为 56, (G, u). 

已 知 图 G, 和 G, 的 根 分 别 为 x 和 v， 令 图 G 表 示 将 u 和 v 相 连 得 到 的 图 ， 很 明显 ， 得 到 下 面 的 
规则 : 

规则 1: DG, UDG, VID (G, WYUDG,, vy) 都 是 包含 4 的 G 的 完全 支配 集 。 

规则 1.1: DG, WUD(G,, v) 的 代价 是 6 (Gi, u) + ô (G2, v)。 
规则 1.2; D,(G1，WUD3;(G,，v) 的 代价 是 61(G1, u) + ô (G, v)+clu, v)。 
规则 2: DAG, WUD,(G,, v) 和 D3(G,, uJUD(G,, vy) 都 是 不 包含 u 的 G 的 完全 支配 集 。 
规则 2.1: D,(G,, WUD,(G,, vy) 的 代价 是 56, (Gi, u) + ô, (G, v). 
规则 2.2，D;(G/，W)UD1(G;,，v) 的 代价 是 5 (G,, uw) + ô (Ga, v)+c(u, v) 

应 用 动态 规划 策略 寻找 图 的 最 优 完 全 支配 集 的 基本 原理 总 结 如 下 : 

如 果 图 G 可 分 解 为 两 个 子 图 G, 和 G，， 通 过 将 G1 的 x 和 6G; 的 v 相 连 进 行 G6 的 重 构 ， 那 么 表示 为 
D(G) 的 G 的 最 优 完全 支配 集 可 以 按 如 下 方法 得 到 ， 

(1) 如 果 61(G1, u) + 5(G 由 小 于 5(G， u) + 6(G,, v)+clu, v), 那么 置 Di(G， uyAD (G,, 
uUD\(G,, v), 5(G, wHd(G,, u) + 5(G,, v); BMBD(G, uy AD (G, uJUD{G,, v), 
ô(G, u)AV6(G,, u) + 6(G,, v)+clu, Vv). 

(2) nR ôG, u) + lGa, vyh T(G, u) + 6(G,, v)+clu, v), PBABDIG, ADAG, 
uJUDAG,, v), (G, u)Ad(G,, u) + 6,(G2, Vv); GWU BDAG, uyADG,, WUD (G, v), 
ôG, už (G, u) + 6\(G2, v)+clu, v) 

(3) D(G, u)=DG,, u)+ DG), v). 

ô (G, u)=6(G,, u) + 6G2, v). 

(4) RSG, uh Fd(G, u), PABDIGADIG, u), HMBDG)ADIG, u), 

上 面 的 规则 适用 于 一 般 的 图 。 在 下 面 将 考虑 树 。 对 于 树 ， 使 用 特殊 的 从 叶子 结 点 出 发 向 内 
部 结 点 前 进 的 算法 。 在 介绍 这 种 树 的 特殊 算 靶 之 前 ， 用 一 个 完整 的 例子 说 明 这 种 算法 。 再 次 参 
见 图 7-25， 只 从 叶子 结 点 w 出 发 ， 仅 有 两 种 情况 : 完全 支配 


集 包含 w ,或 不 包含 w， 如 图 7-27 所 示 。 v “ 
很 容易 得 到 
Dv, v=}, ~ 
DA({v1}, vi) 不 存在 ， vi 


如 


D({v,}, v) = 9, 
ô ({vi}, vy =e) =41, . 图 7-27 包含 的 完全 支配 集 的 计算 
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ô ({vi}, v) =% 
和 6; ({v}, v)=0, 
现在 考虑 只 包含 w: 的 子 树 。 可 以 再 次 得 到 : 
Div}, V2) = {v9}, 
Div}, vdAFEE, 
Ds({v2}, v2) = 9, 
ô ({v2}, v2) = c) = 13, 
ô {v}, v2) = o， 
和 ô ({v2}, v2) =0, 
ES v Flv. HF , 如 图 7-28 所 示 。 
通过 动态 规划 计算 {y,，v,} 的 完全 支配 集 过 
程 如 图 7-29 所 示 。 
由 于 min(54，24) = 24， 得 到 
Di({y1, v2}, V2) = {v2}, 
ô (v vo}, v2) = 24, 
由 于 min(w，52) = 52， 得 到 
DJ{¥2, v1}, V2) = {vi}, 
6({¥2, Vi}, v2) =52, 
此 外 ， 
D3({v;，v2}，v2) 不 存在 ， 
6, ({¥,, Va}, V2) = %。 
考虑 只 包含 w% 的 树 。 显 然 
Di({v3}, v3) = {v5}, 
Ds({v3}，v;) 不 存在 ， 
Ds({v3}, v3) = 9, 
ô ({¥3}, v) =c(v3) = 1, 
6,({v3}, V3) =, 
和 3 ({v3}, v3) =0. 
将 v; 添 加 到 包含 v, 和 v, 的 子 树 ， 如 图 7-30 所 


示 。 

对 于 该 子 树 的 完全 支配 集 的 计算 由 图 7-31 进 
行 说 明 。 

通过 计算 得 出 


Di({vi, V2, V3}, V2) = {v2, V3}, 
Ds({v1，vV2，V3}，V2) 不 存在 ， 
Ds({v1, Y2, V3}, v2) 不 存在 ， 
Ô (Yis Vo, Vs}, V2) = cv) + c(v3) + 
c(y,, v =13 +1411 =25, 
6,({V1, V2, V3}, V2 = %, 
和 Hve V2, v3}, V2) = co。 
考虑 如 图 7-32 所 示 的 包含 vs 和 v4 的 子 树 。 





图 7-28 包含 w 和 的 子 树 


(规则 1.0D 
54 


(规则 1.2) 
24 


(规则 2.2) 
52 


(规则 2.1) 





图 7-30 包含 vi、 多 和 vy; 的 子 树 


(规则 1.1) 
25 


(规则 1.2) 
30 


(规则 2.2) 


oo 


(规则 2.1) 


oo 


图 7-31 对 包含 w ` 名 和 v; 的 子 树 的 完全 
支配 集 的 计算 
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7 Fe 
易 知 下 面 的 结论 是 正确 的 。 16 
D (ys, vy}, Vs) = {vs, va}, Cs) 
Dl {v;, vao Vs) = {va}, 
Di({vs，vs}，vs) 不 存在 ， 15 
5 ({¥5, va}, vs) = clv) + (vs) = 1644 = 20, or 
6,({vs, va}, vs) = clv) + evs, v) =4415= 19, 
All ô; ({vs, Va} 3 Vs) =o, 图 7-32 EE v AvA TA 


现在 车 虑 包含 ww 、”w 和 v: 的 子 树 及 包含 w 和 v 的 子 树 。 就 是 说 ， 考 虑 整 棵 树 的 情况 ， 对 其 完 
全 支配 集 的 计算 如 图 7-33 所 示 。 


(规则 1.0) 
Ôh vs) +Â vV Vtv) =20+25=45 


(规则 1.2) 
edas ho d+ (vm) +e. y) =20+04+4= 0 
(规则 2.2) 


A,r, tsh v) +Â U Va YF. by) +E, v) = 042544 = 90 


CU. D 
Aah v) + ÂV Va mhr) = 194 20 = 0 





图 7-33 对 于 如 图 7-25 所 示 的 整 棵 树 的 完全 支配 集 的 计算 


可 以 得 出 具有 最 小 代价 的 完全 支配 集 是 {fy,，v;，vs，vs}， 其 代价 为 45。 
在 下 面 的 算法 中 ， 令 TP(w) 表 示 以 4 为 根 的 树 的 部 分 构建 过 程 。 





算法 7-2 解决 树 的 带 权 完 全 支配 问题 的 算法 


MA: HT=(V, E, Kaa PS Tie E VAT tc), A Rie © E 有 代价 c(e)。 
输出 : TRA Beit ee SAL RDU), 
步骤 1. 对 十 每 个 质点 vE V，do 
TP(y) = {¥} 
D(TP(y), v) = TP(Y) 
ô (TP(v), v) = cv) 
DTP), vy) 不 存在 
(TP(Y), v)=% 
DATP(V), vl =¢ 
6,(TP(v), v) =0 
步骤 2. T= 了 。 
步 又 3. while 7 有 多 十 1 个 的 顶点 do 
选择 7 的 … 片 叶子 w， 它 与 7 中 唯一 的 顶点 4 相 邻 接 
STP! GO = TP(W)UTP(V)ULe, v} 
If (6,(7P(u), a) + ô (TPO), Y< TPU), 4) + ô (TP), ¥) + ceu, v)) 
DTP! (u), w= DTP), WUD (TP(Y), v) 
Ô, (TP! (u), u)= ô (TP(u), WwW +d) (TPO), v 
Otherwise, 
DTP! (u), u)= D TPU), WUD KTP), v 
d(TP' GO), w= 6 (TP), u) + OATPOWY), v) + elu, v) 
If (6,(7P(u), u) + (TPO), < TPUD, u) + 6(TP(v), v) + ceu, v)) 


一 
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DATP' (u), u) = DATP(u), WUDATP(Y), v) 
ô (TP' (u), u) = 6,(TP(u), u)+ ö&(TP(v), v) 

Otherwise, 
DATP' (u), u) = D(TP(u), DUD (TP), v) 
6, (TP' (u), u) = 6 (TP(u), u) + ô (TP(v), v) + cle, v) 
DATP' (u), u) = D{TP(u), wWUD,TP(r), v) 
Ô, (TP' (u), u) = 6,(TP(u), u) + ô (TP(v), v) 
TP(u) = TP' (u) 
T'=T'-yv; 

end while 

If ô (TP), u) < ô (TP(u), u) 

置 D(T)=D(TP(u), u) 

Otherwise, 

置 D(T)=DTP(u), u) 

返回 D( 站 作为 7T= (V， 忆 的 最 小 完全 支配 集 。 


> 


步骤 


7.8 树 的 带 权 单 步 图 边 的 搜索 问题 


在 带 权 单 步 图 边 的 搜索 问题 中 ,已 知 一 个 简单 无 向 图 G(V, 二 ,其 中 任意 点 v EV 有 权 wi(v)。 
假设 G 的 每 条 边 长 度 相 同 ， 一 个 以 任意 速度 的 逃亡 者 假设 隐藏 在 图 G 的 某 条 边 中 。 对 于 G 中 的 
每 条 边 ， 分 配 一 个 边 的 搜寻 者 来 搜索 该 边 。 边 的 搜寻 者 总 是 从 一 个 点 开始 。 对 于 清理 一 条 边 (w， 
的 代价 ， 如 果 搜 寻 者 搜寻 起 始 于 4w， 那 么 定义 为 wi(w)， 如 果 从 v 搜 寻 ， 那 么 定义 为 wi(v)。 假 设 
每 条 边 的 搜寻 者 以 相同 的 速度 搜寻 。 带 权 单 步 图 边 的 搜索 问题 (weighted single step gragh edge 
searching problem) 是 安排 边 搜寻 者 的 搜索 方向 ， 以 此 种 方式 使 逃亡 者 可 在 一 步 之 内 被 捕获 ， 
并 且 使 所 用 的 搜寻 者 数量 最 少 。 

显然 ， 如 果 有 m 条 边 ， 那 么 至 少 需要 mm 位 边 搜寻 者 。 因 为 逃亡 者 的 速度 与 边 的 搜寻 者 一 样 
快 ， 并 且 边 搜寻 者 是 向 前 移动 的 ， 如 果 逃 亡者 不 能 偷偷 地 穿越 一 个 搜索 过 的 点 而 隐藏 在 搜寻 者 
的 后 面 ， 那 么 搜寻 者 队伍 能 够 在 单 步 内 逮捕 到 逃亡 者 。 

参见 图 7-34。 在 这 个 案例 中 ， 只 需要 一 个 边 的 搜寻 
者 。 不 管 搜寻 者 初始 配置 在 哪儿 ， 逃 亡者 都 不 可 能 逃脱 。 
假设 搜寻 者 配置 在 4 并 向 b 方 向 搜索 。 逃 亡者 顶 多 可 到 b， ”图 734 一 个 不 需要 额外 搜寻 者 的 情况 
但 是 随后 搜寻 者 就 会 达到 5b， 抓 住 逃亡 者 。 类 似 地 ， 如 果 搜寻 者 初始 配置 在 9，， 也 可 达到 同样 的 


目的 。 也 就 是 ， 逃 亡者 在 一 步 之 内 就 会 被 逮捕 。 

现在 ， 参 见 图 7-35。 通 过 把 搜寻 者 放 在 c 和 c， 也 可 
ee omy a 图 7-35 另 一 个 不 需要 额外 搜寻 者 的 情况 

在 此 情况 下 ， 如 果 只 用 3 个 搜寻 者 ， 那 么 不 管 如 何 安排 搜索 方向 ， 逃 亡者 是 可 能 避免 被 捕 
的 。 例 如 ， 考 虑 下 面 的 搜索 方案 : 

(1) el 的 边 搜寻 者 从 a 向 b 搜 索 。 

(2) e; 的 边 搜寻 者 从 a 向 c 搜 索 。 

(3) e; 的 边 搜寻 者 从 5 向 c 搜 索 。 

CO, MU Hwee, HAT LG le Babi 
不 被 发 现 。 

假设 在 点 b 放 一 个 额外 的 搜寻 者 ， 应 用 上 面 的 搜索 





图 7-36 一 个 需要 额外 搜寻 者 的 情况 
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方法 ， 这 样 不 管 逃 亡者 初始 在 哪里 ， 都 会 被 发 觉 。 这 表明 在 一 些 情况 下 ， 和 需要 额外 的 搜寻 者 。 
单 步 搜索 计划 是 安排 边 的 搜寻 者 的 搜索 方向 ， 确 定 需要 的 额外 搜寻 者 的 最 小 数量 。 单 步 搜 
索 方 案 的 代价 是 所 有 搜寻 者 的 代价 之 和 。 带 权 单 步 搜索 问题 是 用 最 小 的 代价 找到 一 种 可 行 的 单 
步 搜 索 方案 。 对 于 上 面 的 例子 ， 这 个 搜索 方案 的 代价 是 wi(a) + 2wi(b) + wi(a)。 
带 权 单 步 图 边 的 搜索 问题 对 一 般 的 图 是 NP 难 的 ， 但 是 应 该 指出 ， 应 用 动态 规划 策略 可 以 
在 多 项 式 时 间 内 解决 树 的 带 权 单 步 图 边 的 搜索 问题 。 
解决 这 个 问题 的 动态 规划 方法 是 基于 几 个 基本 规则 ， 这 些 规则 解释 如 下 。 
首先 定义 一 些 记 号 。 
令 v 为 树 中 的 -一 个 点 。 Gy) 
情况 1; v 是 一 个 叶子 结 点 ， 那 么 TUv) 表 © 
示 w 和 它 的 父 结 点 ， 如 图 7-37a 所 示 。 


情况 2: "是 一 个 内 部 结 点 ， 但 不 是 根 结 C) 
点 ， 那 么 T(w) 表 示 包 含 w、 父 结 点 w 及 所 有 
后 代 结 点 的 树 ， 如 图 7-37b 所 示 。 Ci) 

情况 3: v 是 树 7 的 根 ， 那 么 Ttv) 表 示 T， 


如 图 7-37c 所 示 。 

进一步 地 ， 令 vj 是 v 的 父 结 点 。C(T(v)， 
vis v) (CT), v v) 表示 一 个 最 优 的 单 图 7-37 人 的 定义 
步 搜索 方案 代价 ， 其 中 (v， 的 搜索 方向 是 从 v; Bijv, (Avf). 

规则 1， 令 r 是 树 的 根 ，C(T(r)，r)(C(T(r)，r)) 是 带 (不 带 ) 配置 在 r 的 额外 搜寻 者 的 树 7 的 
一 个 最 优 单 步 搜索 方案 的 代价 。 这 样 ， 对 于 树 7 的 一 个 最 优 单 步 搜索 方案 的 代价 ， 表 示 为 
CT, BCT), 与 C(T(r)，7)) 中 的 小 者 。 

规则 2， 令 /为 树 根 ， 其 中 Vv ，v，,，…，vy 为 ?的 后 代 结 点 ( 见 图 7-38)。 如 果 没 有 额外 守卫 配 
Biter, MA, vy). (va), oy VERA REBATE, v s Un REMY, 
Vor ty Vy, BS, MERA De er, GE, EA, VBR TARRE. 

也 就 是 ， 


a) b) c) 


C(T(r), r)= nin] Seo ra). $ arov] 


C(T(r), r)= wi(r)+ > min{C(T(v,),r,v;), C(T(v,),v,,7)} 





图 7-38 规则 2 的 解释 图 7-39 规则 3 的 解释 
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规则 3: 令 x 是 一 个 内 部 结 点 ，w 是 它 的 父 结 点 并 且 w，m，…， 交 是 它 的 后 代 结 点 (图 7-39)。 

如 果 设 有 额外 守卫 配置 在 4， 那 么 tw， 妇 的 搜索 方向 是 从 w 到 & (从 wu 到 w)， 所 有 (u,v1),，(u， 
Vo), ty (Uy v, JERR TRAE, v2, e, VB 《从 zw 到 v1，v,，…，vV,)。 如 果 一 个 额外 守 
卫 配 置 在 4， 那 么 (x，v) 的 搜索 方向 可 以 单独 确定 。 令 C(T(4)，w，u，)(C(T(w)，w，u，)) 表 
示 最 优 的 单 步 搜 索 方 案 的 代价 ， 其 中 边 (4，w) 的 搜索 方向 是 从 w 到 x， 并 且 不 需要 额外 的 守卫 配 
置 在 顶点 (需要 额外 的 警卫 配置 在 顶点 u)。 类 似 地 , SCTU), u, w，N)(C(T(u),， u, w, 
4)) 表 示 最 优 单 步 搜 索 方案 的 代价 ， 其 中 边 (n，w) 的 搜索 方向 是 从 xu 到 w， 并 且 不 需要 额外 的 守 
TARE Se (需要 额外 的 警卫 配置 在 顶点 x)。 这 样 ， 得 到 如 下 的 公式 : 


C(T(u),w, u, HW) = wt(w) + De 


C(T(u) ,w,u,u) = wt(w) + wt(u) + $ mingCCH) 90.7). 


C(T(u),u,w, U) = wt(u) + CMa) 


和 C(T(u),u,w, u) = 2wt(u) + Y miCCH v) CTO uv) 


C(T(u),w, u) = min{C(T(u),w,u, u), C(T(u),w,u,u)} 
C(T(u),u,w) = min{C(T(u),u,w, u),C(T(u),u,w,u)} 
最 后 ， 得 到 一 个 涉及 边界 条 件 的 规则 。 
规则 4: 如 果 u 是 一 个 叶子 结 点 ，w 是 它 的 父 结 点 ， 那 么 C(T(w),w,w) = ww) RCT), u,w) 
= wi(u), 
通过 从 叶子 结 点 逐渐 向 树 根 移动 ， 动 态 规划 策略 解决 带 
权 单 步 图 边 的 搜索 问题 。 如 果 结 点 是 叶子 结 点 ， 那 么 使 用 规 
则 4。 如 果 结 点 是 内 部 结 点 , 但 不 是 根 结 点 ， 那 么 使 用 规则 3。 
如 果 结 点 是 根 结 点 ， 那 么 先 使 用 规则 2， 最 后 使 用 则 1。 
通过 一 个 例子 来 曾 释 这 个 方案 ， 参 见 图 7-40 所 示 的 带 权 树 。 





使 用 动态 规划 方法 的 过 程 如 下 : 5 © (5) | 
步骤 1. 选择 叶子 结 点 v;， 应 用 规则 4，v3 的 父 结 点 是 vi。 
CTs), vi, ¥3) = wily) =4 图 7-40 一 棵 阐释 动态 规划 策略 的 树 


C(T(y3), V3, vi) = wi(y;) = 20。 
步骤 2. 选择 叶子 结 点 ww， 应 用 规则 4，vw 的 父 结 点 是 >。 
C(T(¥4)5 Vz, Va) = wt(v2) = 2 
C(T(v4)s Vay V2) = wiv) = 5。 
步骤 3. 选择 叶子 结 点 vs， 应 用 规则 4，v; 的 父 结 点 是 v。 
C(T(vs), Va; Vs) = wt(v,) =2 
C(T(vs), vs, v) = wi(vs)= 1, 
步骤 4. 选择 内 部 结 点 v。， 它 不 是 根 结 点 ， 应 用 规则 3，v 的 父 结 点 是 Vi，，v 的 后 代 结 点 是 va 和 vs。 
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C(T(v2),¥;5¥2) = min{C(T(v:), Vi, V2, v, ), CCTV.) ,v1, v2, V2) 
C(T(v3), Vis V25 v,) = wt(v,) + C(T(v4) , Y4, V2) + CCT (Vs), ¥55 V2) 
=4+54+1=10 
C(T(v2) V1 5V25 va ) = wt(v,) + wi(v) + min{C(T(v4),V2,V4),C(T(va), Vas V2) F 
+ min{C(T(vs) va, ¥s),C(TWs) Vs: V2)$ 
=4+2 + min{2,5} + min{2,1} 
=6+2+1=9 
C(T0), vi, v2) = min{10,9}=9 
注意 ， 上 面 的 计算 表明 ， 如 果 (v;，v2) 的 搜索 方向 是 从 v, 到 v,， 那 么 最 优 的 搜索 方案 如 图 7- 
41 所 示 ， 一 个 额外 的 守卫 配置 在 v,。 
C(T(v») ,vv = min{C(T(v2),¥2, v1, v, ), C(T(v), V2, Vis v2)} 
C(T(v:), v3, V1, v, ) = wt(v,) + C(T(va), v2, V4) + C(T(v5), V23 V5) 
=2+2+2=0 
CITO), Va, Vis Va) = WH.) + wt(v,) + min{C(T(v4) , Y2, Y4), C(TO4) ,Va V2)} 
+ min{C(T(vs) , v2, Vs), C(TO5), Vs, V2) } 
=2 +2 + min{2,5} + min{2,1} 
=4+2+1=7 
CT ,vv1) = min{6,7}=6 
上 面 的 计算 表明 ， 如 果 (v,，v;) 的 搜索 方向 是 从 v, 到 v,， 那 么 最 优 的 搜索 方案 如 图 7-42 所 示 。 


Oj 


(a )2+2 (此 处 有 一 个 额外 的 警卫 ) 只 )2+2+2 
O O 
图 7-41 一 个 包含 v, 的 单 步 搜索 方案 图 7-42 另 一 个 包含 v, 的 单 步 搜索 方案 


步骤 5. 选择 w， 因 为 它 是 根 结 点 ， 应 用 规则 2。 
C(T(v,), V) = min{ CTC), vi sva) + CTOs), vis v3), CTO), V2.4) + COs), v3, v0)} 
= min{9 + 4,6 + 20} 
= min{13,26} 
=13 
通过 回溯 了 解 到 ， 如 果 没 有 额外 的 守卫 配置 在 v,， 那 么 最 优 的 搜索 方案 如 图 7-43 所 示 。 
CT = we(v,) + min{C(T(,), v, +¥2).C(T(v2),¥25¥1)} 
+ min{C(T(v3), vi, v3), CGO ¥3 Vid 
= 4+ min{9,6} + min{4,20} 
=44+6+4=14 
通过 回 湖 了 解 到 ， 如 果 一 个 额外 的 守卫 配置 在 位 置 w， 那 么 最 优 的 搜索 方案 如 图 7-44 所 示 。 
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图 7-43 一 个 包含 w 的 单 步 搜索 方案 图 7-44 另 一 个 包含 w 的 单 步 搜索 方案 
最 后 ， 应 用 规则 1。 


C(T(v,)) = min{C(T(,),v,), CTO), v, )} 
= minf{ 14,13} = 13 


这 表明 没有 额外 守卫 配置 在 v,， 那 么 最 优 的 搜索 方案 如 图 7-43 所 示 。 
在 每 个 点 上 有 2 个 操作 数 ， 一 个 是 计算 最 小 搜索 代价 ， 另 一 个 是 确定 边 的 搜索 方向 。 因 此 ， 
操作 的 总 数 是 OCn)， 其 中 4 是 树 中 的 结 点 数 。 由 于 每 个 操作 花费 常数 时 间 ， 所 以 这 是 一 个 线性 


7.9 用 动态 规划 方法 解决 1 螺旋 多 边 形 m 守 卫 路 由 问题 


m 和 守卫 路 由 问题 (m-watchmen routes problem) 定义 如 下 : 已 知 一 个 简单 多 边 形 及 整数 m > 
1， 要 求 为 mm 名 守卫 找到 路 由 ， 称 为 m 守 卫 路 由 ， 使 得 多 边 形 的 每 个 点 都 至 少 被 一 名 守卫 从 他 路 
由 的 某 个 位 置 所 见 到 。 其 目标 是 路 由 的 长 度 之 和 最 小 。m 守 卫 路 由 问题 已 证 明 是 NP 难 的 。 

在 本 节 中 ， 将 说 明 1 螺 旋 多 边 形 的 m 守 卫 路 由 问题 可 以 用 动态 规划 方法 来 解决 。 回 忆 第 3 章 ， 
将 1 螺旋 多 边 形 定义 为 分 界线 可 以 分 解 为 凸 链 和 反射 链 的 简单 多 边 形 。 通 过 遍历 1 螺旋 多 边 形 的 
边界 ， 将 反射 链 的 起 始点 和 终止 点 分 别称 为 w 和 v。 图 7-45 所 示 为 1 螺旋 多 边 形 的 3 守卫 路 由 问 
题 的 解 。 

其 基本 思想 是 通过 从 反射 链 的 某 点 内 部 平分 线 将 1 螺旋 多 边 形 分 为 两 个 部 分 ， 如 图 7-46 所 
示 。 经 过 v 的 内 部 平分 线 与 号 链 相交 ， 将 1 螺旋 多 边 形 分 成 两 部 分 : 两 个 都 是 1 螺旋 的 ， 或 者 一 
个 是 1 螺旋 另 一 个 是 凸 的 。 我 们 称 包含 w 的 子 多 边 形 为 左 子 多 边 形 ， 而 另 一 个 为 相对 于 v 的 右 子 
多 边 形 。 顶 点 w 称 为 切割 点 (cut point) 。 为 了 方便 后 面 的 讨论 ， 将 反射 链 的 起 始点 w 《终止 点 
v) 的 内 部 平分 线 定义 为 凸 链 的 起 始 边 〈 终 止 边 )。 





图 7-45 1 螺旋 多 边 形 的 3 守卫 路 由 问题 的 解 图 7-46 求解 m 守 卫 路 由 问题 的 基本 思想 
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将 记名 守卫 分 配 到 如 下 的 两 个 子 多 边 形 中 : 一 名 守卫 在 左 子 多 边 形 中 ，(x 一 D) 名 守卫 在 右 


子 多 边 形 中 。 


假设 知道 怎样 解决 1 守卫 路 由 问题 ， 那 么 (m 一 1) 守 卫 路 由 问题 可 以 递归 地 解决 。 就 


是 说 ， 可 以 再 次 将 右 子 多 边 形 划分 成 两 部 分 ,分配 一 名 守卫 到 左边 ，(m 一 2) 名 和 守卫 到 右边 。m 
守卫 路 由 问题 可 以 通过 穷尽 尝试 全 部 可 能 的 切割 点 和 选择 一 个 具有 最 短路 由 长 度 和 的 方法 得 到 
解决 。 下 面 说 明 为 什么 这 种 方法 是 动态 规划 方法 。 

参见 图 7-47， 假 设 要 解决 一 个 3 守卫 路 由 问题 。 用 动态 规划 方法 解决 这 个 3 守卫 路 由 问题 的 
方法 如 下 。 令 SP(w， 攻 表示 边界 在 w 和 内 部 平分 线 间 的 子 多 边 形 。 

(1) 寻找 下 面 的 1 守卫 路 由 的 解 。 


: 对 SP(v,，v2) 的 1 守卫 路 由 的 解 。 
: 对 SP(v,， v,) 的 1 守卫 路 由 的 解 。 
: XSP, v) 的 1 守卫 路 由 的 解 。 
; 对 SP(v,，v) 的 1 守卫 路 由 的 解 。 
: 对 SP(v,，vs) 的 1 守卫 路 由 的 解 。 
: 对 SP(v,，vs) 的 1 守卫 路 由 的 解 。 
: HSP, v) 的 1 守卫 路 由 的 解 。 
， 对 SP(v,，vs) 的 1 守卫 路 由 的 解 。 i 

:对 SP(v;，ve) 的 1 守卫 路 由 的 解 。 图 7-47 在 反射 链 中 有 六 个 点 的 1 螺旋 多 边 形 
解 10: 
解 11: 
fit 12 





对 SP(v。，vs) 的 1 守卫 路 由 的 解 。 
对 SP(w，vo) 的 1 守卫 路 由 的 解 。 
对 SP(v;， ye) 的 1 守卫 路 由 的 解 。 


(2) 寻找 下 面 的 2 守卫 路 由 的 解 。 


解 13: 


解 14: 


解 15: 


对 SP(v,，ve) 的 2 守卫 路 由 的 解 。 

首先 得 到 下 面 的 解 : 

解 13-1: 组 合 解 4 和 解 9。 

解 13-2: 组 合 解 5 和 解 11。 

解 13-3: 组 合 解 6 和 人 解 12。 

在 解 13-1、 解 13-2 和 解 13-3 中 选择 具有 最 短 长 度 的 解 作为 解 13。 
SP(v;，ve) 的 2 守卫 路 由 的 解 。 

首先 得 到 下 面 的 解 : 

解 14-1: 组 合 解 7 和 解 11。 

解 14-2: 组 合 解 8 和 和解 12。 

在 解 14-1 和 解 14-2 中 选择 具有 最 短 长 度 的 解 作为 解 14。 
SP(v，veo) 的 2 守卫 路 由 的 解 。 

通过 组 合 解 10 和 解 12 即 可 得 到 。 


(3) 通过 寻找 下 面 的 解 求 初始 问题 的 3 守卫 路 由 的 解 。 
解 16-1: 组 合 解 1 和 解 13。 
解 16-1: 组 合 解 2 和 解 14。 
解 16-1: 组 合 解 3 和 解 15。 
在 解 16-1、 解 16-2 或 者 解 16-3 中 ， 选 择 任何 一 个 都 具有 最 短 长 度 的。 
讨论 表明 m 和 守卫 路 由 问题 可 以 通过 动态 规划 方法 求解 。 注 意 到 动态 规划 方法 的 本 质 是 从 解 
决 基本 问题 开始 ， 然 后 逐渐 通过 组 合 这 些 已 求解 的 子 问题 解决 更 复杂 的 问题 。 首 先 解 决 所 有 相 
关 的 1 守卫 路 由 问题 ， 然 后 是 2 守卫 路 由 问题 ， 等 。 
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令 OWP.(v,，v.) 表 示 子 多 边 形 $SP(v;，v) 的 最 优 k 守 卫 路 由 的 长 度 。 最 优 m 守 卫 路 由 OWP,,(v,， 
v) 可 以 通过 下 面 的 公式 得 到 : 

HF2<k<m—1l, s+ 1<ixe-l, 

OWR,(¥,, v)= min {OWR,(v,,v,) + OWR, (0; v,)} 


OWR va Vv.) = min {OWR,(v,,v,)+ OWR,_(¥;,¥.)} 
tb pce - J 


1 守卫 路 由 问题 在 这 里 不 再 详 述 ， 因 为 我 们 的 主要 
目的 只 是 表明 这 个 问题 可 以 用 动态 规划 方法 求解 。 图 
7-48 表 明 1 守 卫 路 由 问题 的 一 个 典型 的 解 ， 图 7-49 表 明 “tH 

图 7-48 在 1 螺旋 多 边 形 中 一 种 典型 的 1s 
一 种 特殊 的 情况 。 fen Ch olen 7 








a) Lp Re nq 在 b) p 或 9 都 在 多 边 形 c) fp 或 者 4 之 一 
多 边 形 内 部 的 外 部 与 反射 链 相 交 


图 7-49 在 1 螺旋 多 边 形 中 1 守卫 路 由 问题 的 特殊 情况 


7.10 实验 结果 


为 了 说 明 动 态 规划 的 能 力 ， 我 们 在 计算 机 上 实现 了 用 动态 规划 方法 解决 了 最 长 公共 子 序列 
问题 ， 也 在 同 . 台 计 算 机 上 编程 了 直接 的 方法 。 表 7-7 描 述 了 实验 的 结果 ， 结 果 清 楚 地 表明 了 
动态 规划 的 优势 。 


表 7-7 实验 结果 
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动态 规划 方法 穷 举 方法 
4 <I 20 
6 <2 172 
8 <2 2 204 
10 32 952 


493 456 


7.11 注释 与 参考 


术语 动态 规划 据说 是 由 Bellman (1962) 发 明 的 。 关 于 该 主题 许多 作者 都 写 了 书籍 : 
Nemhauser (1966); Dreyfus and Law (1977) 和 Denardo (1982), 

在 1962 年 ，Bellman 对 于 动态 规划 解决 组 合 问题 的 应 用 做 了 回顾 (1962)。 对 于 资源 配置 和 
调度 问题 的 动态 规划 公式 出 现在 文献 Lawler and Moore (1969)，Sahni (1976) 和 Horowitz and 
Sahni (1978) 中 。 旅 行商 问题 的 动态 规划 公式 应 归于 文献 Held and Karp (1962) 和 Bellman (1962), 
对 于 最 长 公共 子 序列 问题 的 动态 规划 应 用 由 文献 Hirschberg (1975) 提 出 。 解 决 0/1 背 包 问 题 的 动 
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态 规划 方法 可 在 文献 Nemhauser and Ullman (1969) 和 Horowitz and Sahni(1974) 中 找到 。 使 用 动 
态 规划 方法 对 最 优 二 又 查找 树 的 构造 可 在 文献 Gilbert and Moore (1959), Knuth (1971) 和 Knuth 
(1973) 中 找到 。 对 于 树 的 带 权 完全 支配 集 问题 的 动态 规划 的 应 用 可 在 文献 Yen and Lee (1990) 中 
找到 ， 解 决 单 步 检 索 问 题 可 在 文献 Hsiao，Tang and Chang (1993) 中 找到 。2 序 列 比 对 算法 可 在 
文献 Neddleman and Wunsch (1970) 中 找到 ， 而 对 于 RNA 次 级 结构 预测 可 在 文献 Waterman and 
Smith (1978) 中 找到 。 

在 本 书 中 没有 提 及 的 动态 规划 的 其 他 重要 应 用 ， 包 括 系 列 矩 阵 相 乘 : Godbole (1973); Hu 
and Shing (1982); Hu and Shing (1984)， 所 有 点 对 的 最 短路 径 : Floyd (1962);， 上 下 文 无 关 语 言 
的 系统 化 分 析 : Younger (1967)， 与 /或 串 并 联 图 : Simon and Lee (1971), LAR Viterbi fees . 
Viterbi (1967) 和 Omura (1969), 

动态 规划 可 以 与 分 支 限界 法 一 起 使 用 ， 可 参阅 文献 Morin and Marsten (1976)。 它 也 用 于 解 
决 一 类 特殊 的 划分 问题 ， 可 参阅 文献 Garey and Johnson (1979) 的 4.2 节 ， 此 观点 也 被 Hsu and 
Nemhauser (1979) 所 使 用 。 


7.12 进一步 的 阅读 资料 


由 于 动态 规划 是 如 此 优美 ， 所 以 在 计算 机 科学 领域 中 ， 已 经 有 很 长 时 间 在 理论 和 实践 中 -一 
直 是 研究 主题 。 为 了 进一步 地 研究 ， 推 荐 下 面 的 论文 : Akiyoshi and Takeaki (1997); Auletta, 
Parente and Persiano (1996); Baker (1994); Bodlaender (1993); Chen, Kuo and Sheu (1988); 
Chung, Makedon, Sudborough and Turner (1985), Even, Itai and Shamir (1976); Farber and 
Keil (1985); Fonlupt and Nachef (1993), Gotlieb (1981); Gotlieb and Wood (1981), Hirschberg 
and Larmore(1987); Horowitz and Sahni (1974); Huo and Chang (1994); Johnson and Burrus 
(1983); Kantabutra (1994); Kao and Queyranne (1982), Kilpelainen and Mannila (1995), 
Kryazhimskiy and Savinov (1995); Liang (1994); Meijer and Rappaport (1992); Morin and 
Marsten (1976); Ozden(1988), Park (1991); Peng, Stephens and Yesha (1993); Perl (1984), 
Pevzner (1992); Rosenthal (1982); Sekhon (1982); Tidball and Atman (1996); Tsai and Hsu 
(1993); Tsai and Lee (1997); Yannakakis (1985); Yen and Lee (1990); Yen and Lee (1994) and 
Yen and Tang (1995), 

以 下 是 有 趣 的 新 成 果 的 列表 : Aho，Ganapathi and Tjang (1989), Akutsu (4996), Alpert 
and Kahng (1995); Amini, Weymouth and Jain (1990); Baker and Giancarlo (2002); Bandelloni, 
Tucci and Rinaldi(1994); Barbu (1991); Brown and Whitney (1994), Charalambous (1997); 
Chen, Chern and Jang (1990); Cormen (1999); Culberson and Rudnicki (1989), Delcoigne and 
Hansen (1975); Eppstein, Galil, Giancarlo and Italiano (1990); Eppstein, Galil, Giancarlo and 
Italiano (1992(a)); Eppstein, Galil, Giancarlo and Italiano (1992(b)); Erdmann (1993); Farach 
and Thorup (1997), Fischel-Ghodsian, Mathiowitz and Smith (1990); Geiger, Gupta, Costa 
and Viontzos (1995); Gelfand and Roytberg (1993); Galil and Park (1992), Hanson (1991); 
Haussmann and Suo (1995); Hein (1989), Hell, Shamir and Sharan (2001); Hirosawa, Hoshida, 
Ishikawa and Toya (1993); Holmes and Durbin (1998), Huang, Liu and Viswanathan (1994), 
Huang and Waterman (1992), Ibaraki and Nakamura (1994), Karoui and Quenez (1995); Klein 
(1995); Kostreva and Wiecek (1993); Lewandowski, Condon and Bach (1996), Liao and 
Shoemaker (1991); Lin, Fan and Lee (1993); Lin, Chen, Jiang and Wen (2002), Littman, 
Cassandra and Kaelbling (1996); Martin and Talley (1995); Merlet and Zerubia (1996); Miller 
and Teng (1999); Mohamed and Gader (1996), Moor (1994), Motta and Rampazzo (1996), 
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Myoupo (1992), Ney (1984); Ney (1991); Nuyts, Suetens, Oosterlinck, Roo and Mortelmans 
(1991), Ohta and Kanade (1985); Ouyang and Shahidehpour (1992), Pearson and Miller 
(1992); Rivas and Eddy (1999); Sakoe and Chiba (1978); Schmidt (1998); Snyder and Stormo 
(1993), Sutton (1990), Tataru (1992); Tatman and Shachter (1990), Tatsuya (2000); Vintsyuk 
(1968); Von Haeselerm, Blum, Simpson, Strum and Waterman (1992), Waterman and Smith 
(1986); Wu (1996); Xu (1990) and Zuker (1989), 


习题 
71 见 下 图 。 用 动态 规划 方法 找 出 从 $ 到 7 的 最 短路 由 。 





7.2 对 于 显示 在 图 7-1 中 的 图 ， 使 用 分 支 限 界 方法 解决 同样 的 问题 。 对 于 此 问题 ， 哪 个 方法 〈 动 态 
规划 与 分 支 限 界 方法 对 比 ) 更 好 ? 为 什么 ? 

7.3 对 于 显示 在 图 7-13 中 的 图 ， 用 分 支 限界 方法 解决 旅行 商 问题 ， 并 将 它 与 动态 规划 方法 进行 对 比 。 

7.4 对 于 下 面 的 表 ， 有 三 个 项 目 和 四 个 资源 ， 找 出 一 个 最 优 的 资源 分 配 从 而 得 到 最 大 总 利润 。 





7.5 使 用 动态 规划 解决 下 面 的 线性 规划 问题 。 

最 大 化 x) = 8x, + 7x, 

应 满足 2x, + x,<8 
5x, + 2x,<15 

其 中 x 和 xz 是 非 负 整数 。 

7.6 PHS, =aabcdaef 和 5S,=beadjf 的 最 长 公共 子 序列 。 

7.7 一 般 ， 划 分 问题 是 NP 完全 的 。 然 而 ， 在 一 些 限制 下 ， 因 为 多 项 式 问题 可 以 通过 动态 规划 解决 ， 
所 以 这 是 一 类 特殊 的 划分 问题 。 参 阅 文献 Garey and Johnson(1979) 的 4.2 节 。 

7.8 找 出 a;/，a;，…，、ae 的 一 个 最 优 二 又 树 ， 如 果 标 识 符 的 概率 按 顺 序 分 别 是 0.2，0.1，0.15，0.2， 
0.3，0.05， 其 他 标识 符 的 概率 为 0。 

19 参见 右面 的 图 : 求解 图 中 所 有 点 对 的 最 短路 径 问 题 。 所 有 
点 对 的 最 短路 径 问题 是 确定 每 对 顶点 间 的 最 短路 径 问题 。 
参考 文献 Horowitz and Sahni(1978) 的 5.3 节 ， 或 者 Brassard 
and Bratley (1988) 的 5.4 节 。 

7.10 Sfx KAR, 并且 y =O. Yo o Wo MAS 是 可 分 
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的 ， 而 且 该 函数 对 于 第 二 个 参数 是 单调 非 递减 的 ， 我 们 说 /可 分 解 为 /和 AU (x, y) = AQ), 
LOD. WEHR, WR AX, y=), APOTI, ABZ 
Opi{f (x, yy} = OpH fix, OpH hO) (Opt = min 或 max) 


(yy) 

(参考 [Minoux 1986] 的 9.2 节 。) 

7.11 佛 洛 伊 德 (Floyd) 算法 可 以 在 许多 教科 书 中 找到 ， 该 算法 可 以 在 一 个 带 权 图 上 找 出 所 有 点 对 
的 最 短路 径 。 举 出 一 个 例子 解释 该 算法 。 

7.12 编写 一 个 动态 规划 算法 ， 求 解 最 长 的 渐 增 子 序列 问题 。 

7.13 已 知 在 字母 表 集 合 2 上 的 两 个 序列 S, 和 3S:， 以 及 一 个 得 分 国 数 疡 DX TOR, AEE RT Tal AE 
找 出 5, 的 子 序列 S; 和 5, 的 子 序列 S$;， 使 得 在 $, 和 5, 的 所 有 可 能 的 子 序列 中 ， 通 过 5 与 5 的 比 对 得 
分 最 高 。 使 用 动态 规划 策略 设计 一 个 O(mn) 时 间 复 杂 度 或 更 好 的 算法 解决 该 问题 ， 其 中 4 和 m 
DNAS FAS HIKE 





第 8 章 NP 完全 性 理论 


NP 完全 性 理论 (theory of NP-completeness ) 也 许 是 计算 机 科学 领域 最 有 趣 的 主题 之 一 ， 
该 领域 主要 的 研究 者 一 一 多 伦 多 大 学 的 S.A. 库 克 教 授 因 其 在 该 领域 内 的 杰出 贡献 而 获得 了 图 灵 
奖 。 毫 无 疑问 ， 在 计算 机 科学 领域 众多 有 趣 的 研究 成 果 中 ，NP 完 全 性 理论 是 最 激动 人 心 、 同 
时 也 是 令 人 迷惑 的 理论 之 一 。 现 在 称 为 库 克 定理 (Cook’s theorem) 的 最 重要 定理 ， 也 许 是 被 
最 广泛 引用 的 定理 。 

本 书 不 仅 介绍 库 克 定理 的 应 用 ， 而 且 尽力 解释 库 克 定理 真正 的 含义 。 


8.1 关于 NP 完 全 性 理论 的 韭 形式 化 讨论 


NP 完 全 性 理论 是 重要 的 ， 因 为 它 确认 了 一 大 类 难 问 题 。 这 里 定义 的 难 问 题 是 指 其 下 界 似 
平 存 在 指数 函数 级 的 问题 。 换 名 话说 ，NP 完 全 性 理论 明确 了 一 大 类 问题 ， 看 上 去 找 不 到 能 解 
决 它们 的 任何 多 项 式 时 间 算 法 。 

概略 地 说 ， 我 们 认为 NP 完全 性 理论 首先 指出 许多 问题 可 称 为 NP 问题 (non-deterministic 
polynomial problem ， 非 确定 型 多 项 式 )。(NP 的 形式 定义 将 在 8.4 节 给 出 。) 并 非 所 有 的 NP 问题 
都 是 难 的 ， 许 多 是 容易 的 。 例 如 ， 搜 索 问 题 是 NP 问题 ， 它 可 以 用 多 项 式 时 间 复 杂 度 的 算法 解 
决 。 另 一 个 例子 是 最 小 生成 树 问 题 ， 该 问题 也 可 以 由 多 项 式 时 间 算 法 解决 。 我 们 称 这 些 问 题 为 
P 问 题 (polynomial problem， 多 项 式 问 题 )。 

由 于 在 NP 问题 集中 包含 许多 P 问 题 ， 可 以 画 一 幅 图 描述 它们 之 间 的 关系 ， 如 图 8-1 所 示 。 

此 外 ， 读 图 表明 还 有 另外 一 大 类 问题 ， 它 们 是 NP 完全 问题 (NP-complete problem) ， 包 含 
在 NP 问题 集 内 ， 如 图 8-2 所 示 。 


© ©) 


图 8-1 NP 问题 集 图 8-2 NP 问题 包含 P 问 题 和 NP 完全 问题 


目前 ， 已 知 的 NP 完 全 问题 集 是 非常 大 的 ， 并 且 一 直 在 增加 。 这 包括 许多 有 名 的 问题 ， 比 
如 可 满足 性 问题 (satisfiability problem) 、 旅 行商 问题 (traveling salesperson problem), LAR 
箱 问题 (bin packing problem)。 所 有 这 些 问题 都 有 一 个 共同 的 特性 : 到 目前 为 止 ， 没 有 一 个 
NP 完 全 问题 在 最 坏 情况 下 可 被 任 一 个 多 项 式 算 法 解决 。 换 名 话说， 直到 现在 ， 在 最 环 情 况 下 ， 
解决 任何 NP 完 全 问题 的 最 好 算法 是 有 指数 时 间 复 杂 度 。 这 里 特别 强调 NP 完 全 性 理论 总 是 讨论 
最 坏 情况 。 

NP 完全 问题 已 经 能 够 通过 具有 多 项 式 平均 时 间 复 杂 度 的 算法 来 解决 。 在 本 章 余 下 的 内 容 
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中 ， 除 非特 别 说 明 ， 在 任何 时 间 讨 论 时 间 复 杂 度 都 是 指 最 坏 时 间 复 杂 度 。 

我 们 并 设 有 是 够 的 兴趣 去 明确 一 个 问题 集 , 其 到 目前 为 止 不 能 通过 任何 多 项 式 算 法 来 解决 。 
根据 对 NP 完全 性 的 定义 ， 下 面 的 结论 是 正确 的 : 

如 果 任 何 NP 完 全 问题 可 在 多 项 式 时 间 内 解决 ,那么 所 有 的 NP 问题 可 在 多 项 式 时 间 内 解决 。 
或 者 ， 如 果 任 何 NP 完 全 问题 能 在 多 项 式 时 间 内 解决 ， 那么 NP=P。 

因此 ，NP 完 全 性 理论 表明 每 个 NP 完全 问题 就 像 一 个 重要 的 柱子 。 如 果 它 倒 下 ， 那 么 整个 
建筑 就 会 倒塌 。 或 者 用 另外 一 种 比喻 方式 ，NP 完 全 问题 好 似 一 位 重要 的 将 军 ， 如 果 他 向 敌人 
投降 ， 那 么 整个 军队 也 会 投降 。 

因为 所 有 的 NP 问 题 都 能 由 多 项 式 算法 解决 是 非常 不 可 能 的 ， 所 以 任何 NP 完 全 人身 题 能 由 任 
何 多 项 式 算 法 解决 更 是 不 可 能 队 

这 里 需要 强调 ，NP 完 全 性 理论 并 未 断言 NP 完全 问题 永 不 能 被 多 项 式 算法 解决 ， 而 只 是 说 
任何 NP 完 全 问题 在 多 项 式 步 数 内 解决 是 相当 不 可 能 的 。 这 对 我 们 尽力 找 出 解决 NP 完 全 问题 的 
多 项 式 算法 多 少 有 些 阻碍 。 


8.2 判定 问题 


我 们 将 本 书 所 考虑 过 的 大 多 数 问题 划分 为 两 类 : 优化 问题 (optimization problems) 和 判 
定 问 题 (decision problems), 

考虑 旅行 商 问题 。 该 间 题 定义 如 下 : 已 知 一 个 点 集合 ， 找 出 从 任何 点 vo 开始 的 最 短 回路 。 
旅行 商 问 题 显然 是 一 个 优化 问题 。 

判定 问题 是 其 阐 单 回答 为 “yes” 或 “no” 的 问题 。 对 于 旅行 商 问题 ， 有 一 个 相对 应 的 判 
ERM, ELF: 已 知 一 个 点 集合 ， 是 否 存 在 从 任何 点 vo 开始 的 回路 ， 其 总 长 度 小 于 已 知 的 
常数 c? 

需要 注意 旅行 商 问 题 比 旅 行商 判定 问题 (traveling salesperson person problem) 困难 得 多 。 
如 果 能 够 解决 旅行 商 问 题 ， 那 么 我 们 会 知道 最 短 回 路 等 于 某 个 值 ， 比 如 是 a。 如 果 a<c， 那 么 
对 旅行 商 判 定 问 题 的 回答 就 是 “yes”， 否 则 就 是 “no”。 因 此 可 以 说 ， 如 果 能 够 解决 旅行 商 问 
题 ， 就 能 够 解决 旅行 商 判 定 问 题 ， 但 反之 不 行 。 所 以 ， 我 们 得 出 结论 : 旅行 商 问题 比 旅行 商 判 
定 问题 困难 得 多 。 

再 看 另 一 个 例子 ， 在 第 5 章 中 已 经 介绍 过 的 0/1 背 包 问 题 ， 定 义 如 下 : 


BM, W40P,, W,>0, P; >0, 1<i<n, M>0, tE X Wa, 和 M 条 件 下 ， 找 出 xz = 1 或 
0， 使 得 Px 最 大 。 


0/1 背 包 问 题 显 然 也 是 一 个 优化 间 题 ， 它 也 有 一 个 相应 的 判定 问题 ， 定 义 如 下 : 
已 知 M，R，W, 和 P,，M>0，R>0，W, >0，P >0，1 <i<n， 确 定 是 否 存在 x,，x; = 1 或 0， 


使 得 yes >R 和 X Wa <M, 


这 很 容易 证 明 0/1 背 包 问 题 比 0/1 背 包 判 定 问题 (0/1 knapsack decision problem) 困难 得 多 。 
一 般 地 ， 优 化 问题 比 它们 相应 的 判定 问题 难以 解决 。 所 以 ， 如 果 只 对 问题 是 否 可 被 多 项 式 
算法 解决 的 讨论 关心 , 那么 可 以 只 考虑 判定 问题 。 如 果 旅 行商 判定 问题 不 能 被 多 项 式 算法 解决 ， 
那么 可 以 推断 旅行 商 问题 也 不 能 被 多 项 式 算法 解决 。 在 讨论 NP 问题 时 ， 将 只 讨论 判定 问题 。 
在 下 一 节 中 ， 将 讨论 可 满足 性 问题 ， 它 是 最 著名 的 判定 问题 之 一 。 
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8.3 可 满足 性 问题 


因为 可 满足 性 问题 (satisfiability problem) 是 找 出 的 第 一 个 NP 完 全 问题 ， 所 以 它 是 很 重要 的 。 
考虑 下 面 的 逻辑 公式 : 


xX, V XV Xs 


下 面 的 赋值 会 使 公式 为 真 。 

x, F 

xXx, F 

XT 

接 下 来 将 使 用 记号 (一 x)/， 一 Xx，) 表 示人 {x1 一 太 ，x2 一 忆 ，X3 一 T}。 如 果 一 个 赋值 使 得 公式 为 
A, 那么 就 说 这 个 赋值 满足 该 公式 ; 否则 ， 它 不 满足 该 公式 。 

如 果 至 少 有 一 个 赋值 能 满足 公式 , 那么 说 此 公式 是 可 满足 的 ; 否则 ,该 公式 是 不 可 满足 的 。 

典型 的 不 可 满足 公式 是 





Xl 
& -xı 
另 一 个 不 可 满足 公式 是 
xX, V XxX, 
& x,V—-x, 
& =x VX, 
& —x,V—-xX, 


可 满足 性 问题 定义 如 下 : 已 知 一 个 布尔 公式 (Boolean formula) ， 确 定 该 公式 是 否 可 满足 。 

在 本 节余 下 的 内 容 中 ， 将 讨论 一 些 解 决 可 满足 性 问题 的 方法 ， 首 先 需要 定义 一 些 术语 。 

定义 文字 (literal) Æx AX, 其 中 x 是 一 个 布尔 变量 。 

ÆN Fó (clause) 是 文字 的 析 取 (disjunction) 。 应 该 明白 没有 子 揣 同时 包含 文字 

及 其 文字 的 非 。 

定义 ”公式 (formula) 2c¢,&c,&---&c,,43 XA FB 5 A (conjunctive normal form) , 

其 中 每 个 c;, (1<i<m) ATA, 

众所周知 每 个 布尔 公式 能 转换 成 合 取 范式 形式 。 所 以 ， 假 定 所 有 的 公式 都 已 经 是 合 取 范 式 
形式 了 。 

定义 ”公式 G 是 公式 F 的 还 辑 结论 ， 当 且 仅 当下 为 真 时 ，G 也 为 真 。 换 向 话 说 ， 每 个 赋 

ERAF, LRAG., 


例如 ， 

-=x V xX» (1) 
& x, (2) 
& Xx; (3) 


是 合 取 范式 形式 的 公式 。 满 足 上 面 公式 仅 有 的 赋值 是 (x;/，x2，xs)。 读 者 可 以 容易 地 推断 x 是 上 
面 公式 的 逻辑 结论 。 已 知 两 个 子 句 
Cy: LVV VL, 
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和 c: -L,VLIN VL, 
可 以 推出 个子 句 
LV VLVLN + VL; 
如 果子 名 
LVOV LVV OVL 
设 有 包含 任何 互补 的 一 对 文字 ， 那 么 可 作为 子 名 ci&c: 的 逻辑 结论 。 
例如 ， 考 虑 下 面 的 子 句 : 
Cys —XIV Xa 
G: AVG 
WA 
Cy: Vy 
是 子 句 ci&c; 的 逻辑 结论 。 
上 面 的 推理 规则 称 为 消解 原理 (resolution principle)， 对 c,/ 和 c; 应 用 消解 原理 产生 的 子 句 c， 
AR ANC Alico) if (resolvent), 
上 髓 看 -个 例子 : 
Cy: max V 一 2 VX 


Cz: XIV Xo 


Cy: XV XV XY 


是 c 和 ec; 的 消解 式 。 当 然 ， 它 也 是 ci&c: 的 逻辑 结论 。 


考虑 下 面 的 两 个 子 句 : 
C1: X 
C3: —X 
那么 消解 式 是 个 特殊 的 子 句 ， 因 为 它 不 包含 文字 ， 表 示 为 
c=] 
它 是 个 空子 句 。 
如 果 能 从 子 句 集中 推导 出 空子 句 ， 那 么 这 个 子 句 集 一 定 是 不 可 满足 的 。 考 虑 下 面 的 子 句 集 : 
XI VX (1) 
xi Vax (2) 
=x V% (3) 
=x V 一 (4) 
可 以 按 如 下 方式 推导 出 空子 句 ; 
(1) &(2) x, (5) 
(3) &(4) —x, (6) 
(5) &(6) C] (7) 


由 于 (7) 是 一 个 空子 句 ， 所 以 可 以 推断 (1)&(2)&(3)&(4) 是 不 可 满足 的 。 
已 知 一 个 子 名 集 ， 我 们 可 以 重复 地 应 用 消解 原理 推导 新 子 句 。 新 子 名 可 以 添加 到 原来 的 子 
人 名 集中 ， 消 解 原理 可 以 再 次 应 用 其 中 。 这 个 过 程 直到 产生 空子 句 或 没有 新 子 句 产生 为 止 。 如 果 
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推导 出 空子 和 ,那么 这 个 子 铅 集 是 不 可 满足 的 。 如 果 当 消解 过 程 终止 而 没有 新 子 负 生成， 那么 


这 个 子 身 集 是 可 满足 的 。 
看 一 个 可 满足 的 子 句 集 
=x V 一 1 VX 
x, 
Xa 
(DE&(2) —x, Vx; 
(4)&(3) x, 
(1)&(3) —x, V x; 
注意 到 从 子 句 (1) 到 (6) 不 再 有 新 子 句 生成 ， 可 以 推断 这 个 子 句 集 是 可 满足 的 。 


如 果 通 过 增加 一 个 一 x 来 修改 上 面 的 子 句 集 ， 那 么 得 到 一 个 不 可 满足 的 子 句 集 : 


=x Vax V 


X 


(1)&(2) =x VX 
(5)&(4) -x 
(6)&(3) CI 


因为 可 以 推导 出 空子 句 ， 所 以 现在 可 以 建立 是 不 可 满足 的 属性 。 


(1) 
(2) 
(3) 
(4) 
(5) 
(6) 


(1) 
(2) 
(3) 
(4) 
(5) 
(6) 
(7) 


对 于 消解 原理 更 多 理论 性 的 讨论 可 参考 有 关机 器 定理 证 明 (mechanical theorem proving) 


的 书籍 。 


在 上 面 的 讨论 中 ,说 明 可 满足 性 问题 可 以 看 作 是 演绎 问题 。 换 句 话 说 ， 就 是 坚持 不 懈 地 如 
找 矛 盾 。 如 果 推 导出 矛盾 ， 就 可 以 断定 子 句 集 是 不 可 满足 的 ， 否 则 是 可 满足 的 。 我 们 采用 的 方 
法 似乎 与 找 出 满足 公式 的 赋值 无 关 。 事 实 上 ， 立 刻 可 以 证 明 演绎 (或 推导 ) 的 方法 等 价 于 拷 出 
赋值 的 方法 。 也 就 是 ， 对 空子 句 的 演绎 的 确 等 价 于 找 出 满足 任何 子 句 赋值 的 失败 。 相 反 地 ， 推 


导 不 出 空子 句 等 价 于 找 出 至 少 一 个 满足 所 有 子 句 的 赋值 。 
从 一 个 最 简单 的 例子 开始 : 
Xl 
—x) 
由 于 上 面 的 子 句 集 只 包含 一 个 变量 x,， 那 么 开始 构造 一 棵 
语义 树 ， 如 图 8-3 所 示 。 
左 分 支 意味 着 赋值 包含 x，( 意 指 x 一 了 )， 而 右 分 支 意 味 着 赋 
Haa- ( 意 指 x, 一 F)。 注 意 到 左 分 支 赋 值 x, 使 得 子 句 (2) 为 假 。 
所 以 用 子 名 (2) 终止 左 分 支 。 类 似 地 ， 用 子 句 (1) 终止 右 分 支 。 图 
8-3 表 明子 旬 ( 了 ) 必 须 包 含 x1/， 而 子 句 (2) 必 须 包 含 -x,。 对 上 面子 P 


句 应 用 消解 原理 推导 出 一 个 新 子 句 ， 就 是 空子 句 ， 表 示 如 下 : 图 8-3 一 棵 语义 树 
(1)&2) CA 
可 将 子 句 (3) 放 在 父 结 点 旁边 ， 如 图 8-3 所 示 。 
考虑 下 面 的 子 句 集 : 


一 XI V —X2V Xs 


(1) 
(2) 


G) 


(3) 


(1) 
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X Vx (2) 
n (3) 
“x (4) 


可 以 构造 如 图 8-4 所 示 的 语义 树 。 在 图 8-4 中 ， 从 树 根 到 终端 结 点 的 每 条 路 径 代 表 了 一 类 赋 
值 。 例 如 ， 每 个 赋值 必须 包含 x, 或 x,。 第 一 
个 右 分 支 标记 为 ~x,， 表 示 所 有 包含 x, 的 赋 
(A (有 四 个 这 样 的 赋值 )。 由 于 子 句 (3) 只 含有 
x;， 这 使 每 个 包含 x, 的 赋值 为 假 。 因 此 ， 第 
一 个 右 分 支 被 子 句 (3) 终 止 。 

考虑 包含 总 、-x3 和 xi 的 路 径 ， 这 个 赋值 
使 子 句 (1) 为 假 。 类 似 地 ， 包 含 x,、 一 x 和 一 x 的 
路 径 表 示 使 子 句 (2) 为 假 的 赋值 。 

考虑 标记 为 (DJ 和 (2) 的 终端 结 点 。 由 于 通 
向 它们 的 分 支 分 别 标记 为 M, FAC) 
定 包 含 ~x/， 而 子 句 (2) 必 定 包含 X%。 对 子 句 (1) Os) 
和 (2) 应 用 消解 原理 ， 可 以 推导 出 子 句 一 xs Vx;。 

这 个 子 句 可 以 标记 为 子 句 (5)， 并 且 邻 接 其 父 
结 点 上 上， 如 图 8-4 所 示 。 使 用 同样 的 推理 ， 可 
以 对 子 名 (3) 和 (4) 应 用 消解 原理 ， 从 而 得 到 子 
名 (6)。 而 子 名 (6) 和 子 名 (3) 是 相互 矛盾 的 ， 由 


(7) (OD) 







(3) (xy) 


(6) (-x) 


(5) (-x2 V x3) 


d) (2) 


此 推导 出 空子 句 。 所 有 这 些 都 表示 在 图 8-4 中 ， 人 Gym) 
整个 推导 过 程 详细 地 描述 如 下 图 8.4 一 棵 语义 树 
(1)&(2) nV (5) 
(4)&(5) TX (6) 
(6)&(3) [J a) 


总 之 ， 已 知 表示 布尔 公式 的 子 句 集 ， 可 以 根据 下 面 的 规则 构造 语义 树 : 

(1) 从 语义 树 的 每 个 内 部 结 点 有 两 个 分 支 离 开 它 。 一 个 用 x 标记 ， 另 一 个 用 -x 标记 ， 这 里 x 
是 出 现在 子 句 集中 的 一 个 变量 。 

(2) 一 个 结 点 被 终止 ， 只 要 对 应 于 出 现在 从 树 根 到 该 结 点 路 径 中 的 文字 赋值 使 子 句 集中 的 
子 句 @) 为 假 ， 就 标记 此 结 点 为 终端 结 点 ， 并 将 子 句 从 连接 到 结 点 上 。 

(3) 在 语义 树 中 没有 路 径 包 含 互 补 对 ， 使 得 每 个 赋值 都 相 容 。 

显然 ， 每 棵 语义 树 都 是 有 限 的 。 如 果 每 个 端 结 点 连接 一 个 子 打 ， 那 么 不 存在 满足 所 有 子 句 
的 赋值 ， 这 意味 着 该 子 句 集 是 不 可 满足 的 ; GUM, 至少 存在 一 个 满足 所 有 子 抽 的 赋值 ， 且 该 子 
句 集 是 可 满足 的 。 


考虑 下 面 的 子 句 集 : 

=x V ax V X (1) 
X, V Xa (2) 
xX V =X (3) 


构造 语义 树 如 图 8-5 所 示 。 
从 上 面 的 语义 树 推断 该 子 句 集 是 可 满足 的 ， 下 面 的 赋值 都 满足 公式 : 


(Xis X2, X3, X4) 








NP 完全 性 理 伦 | 175 





Xis X2, X3, —Xa) 
(=X, Xz, Xz, Xa) 
(xX, 一 MX2， 一 3 X4) 


(-x,, X25 X3, Xa) 


和 (xi, X25 7X3, X4) 


语 


两 
部 


集 : 





图 8-5 一 棵 语义 树 
如 果子 句 集 是 不 可 满足 的 ， 那 么 使 用 消解 原理 的 每 棵 语义 树 都 相对 应 于 空子 名 的 推导 。 从 
义 树 中 提取 的 推导 如 下 : 
(1) 考虑 其 后 代 是 终端 结 点 的 内 部 结 点 ， 假 定 连接 到 两 个 终端 结 点 的 子 句 分 别 是 cj 和 c)。 对 
个 子 句 应 用 消解 原理 ， 将 消解 式 连接 到 它们 的 父 结 点 上 。 同 时 删除 后 代 结 点 ， 那 么 原来 的 内 


结 点 成 为 终端 结 点 。 


(2) 重复 上 面 的 过 程 ， 直 到 语义 树 成 为 空 树 ， 那 么 空子 句 就 推导 出 来 。 
通过 另 一 个 例子 解释 上 面 的 思想 。 考 虑 下 面 的 子 句 


一 XI V —X2 V x3 (1) 
XI VX (2) 
X2 (3) 

—Xx; (4) 

构造 的 语义 树 如 图 8-6 所 示 。 

图 8-6 的 语义 树 可 逐步 地 消减 成 图 8-7。 





推导 过 程 如 下 : 
(1D)&(2) —x, Vx (5) 
(S)&(4) -x (6) (1) (2) 


(6)&(3) CJ] (7) 图 8-6 一 棵 语义 树 











(7) 
©; 
(6) & (3) 
(4) (5) (1) & (2) (6) (3) 
((4) & (5)) 
a) b) c) 


图 8-7 图 8-6 中 语义 树 的 消减 


我 们 展示 了 所 使 用 的 推导 方法 的 确 找到 了 满足 所 有 子 句 的 赋值 。 如 果 有 个 变量 ， 那 么 会 
有 2' 个 可 能 的 赋值 。 到 目前 为 止 ， 在 最 坏 情 况 下 ， 对 于 可 用 的 最 好 算法 ， 在 得 出 任何 结论 前 必 
须 检 查 指数 量 级 的 可 能 赋值 。 

可 满足 性 问题 在 多 项 式 时 间 内 解决 有 可 能 吗 ? NP 完 全 性 理论 并 没有 排除 这 种 可 能 性 ， 但 
做 了 下 面 的 断言 如 果 可 满足 性 问题 可 在 多 项 式 步 数 内 解决 ， 那 么 所 有 的 NP 问题 也 可 在 多 项 
式 步 数 内 解决 。 

到 目前 仍 没 有 定义 NP 问题 ， 这 将 在 下 一 节 中 讨论 。 
8.4 NP 问题 


符号 NP 表示 非 确 定性 多 项 式 。 我 们 首先 定义 非 确 定性 算法 (nondeterministic algorithm ) 
如 下 : 非 确定 性 算法 是 由 猜测 和 验证 构成 的 算法 。 更 进一步 ， 假 定 非 确定 性 算法 总 是 做 出 正确 
的 猜测 。 

例如 ， 给 定 与 具有 特定 布尔 公式 对 应 的 可 满足 性 问题 ， 非 确定 性 算法 首先 猜测 一 个 峰值， 
接着 验证 这 个 赋值 是 否 满足 该 公式 。 需 要 注意 的 概念 是 正确 解 总 是 通过 猜测 得 到 的 。 换 句 话 说， 
如 果 公 式 是 可 满足 的 ， 那 么 非 确 定性 算法 总 是 正确 地 猜测 ， 并 获得 满足 该 公式 的 赋值 。 

考虑 旅行 商 判 定 问 题 ， 非 确定 性 算法 总 是 猜测 一 个 回路 ， 并 验证 回路 是 否 比 常数 c 短 。 

读者 可 能 会 被 非 确定 性 算法 的 概念 所 激怒 ， 因 为 实际 上 不 可 能 有 这 样 的 算法 。 那 么 ， 怎 么 
总 能 做 出 正确 地 猜测 呢 ? 

实际 上 ， 非 确定 性 算法 的 确 并 不 存在 ， 也 决 不 会 存在 。 只 是 因为 它 将 有 助 于 我 们 定义 一 类 
问题 ， 称 为 NP 同 题 ， 非 确定 性 算法 才 有 用 。 

如 果 非 确定 性 算法 的 验证 阶段 是 多 项 式 时 间 复 杂 度 的 ， 那 么 这 个 非 确定 性 算法 称 为 非 确定 
性 多 项 式 算 法 (nondeterministic polynomial algorithm) 。 如 果 判 定 问题 能 被 非 确定 性 多 项 式 算 
法 解决 ， 那 么 该 问题 称 为 非 确定 性 多 项 式 (NP) 问题 (nondeterministic polynomial problem) , 

从 上 面 的 定义 ， 立 即 可 以 推断 出 每 个 能 在 多 项 式 时 间 (当然 根据 确定 性 算法 ) 解决 的 问题 
一 定 是 非 确定 性 多 项 式 问题 。 典 型 的 例子 是 搜索 、 合 并 、 排 序 以 及 最 小 生成 树 等 问题 。 这 里 提 
醒 读 老 我 们 在 讨论 判定 问题 。 搜 索 是 判定 问题 ， 而 排序 显然 不 是 ， 但 总 能 够 产生 来 自 排序 问题 
的 判定 问题 。 最 初 的 排序 问题 是 将 ce, ，% ，…，w 排 序 成 递增 或 递减 序列 。 可 构造 如 下 的 判定 
H: Eaa, an, e, a AC, WEEGEE- Aaa, an o a), Eaa + la; 
—a;l+ = + la-a, 1I<C。 所 有 能 在 多 项 式 时 间 解 决 的 问题 都 称 为 P 问 题 。 

可 满足 性 问题 和 旅行 商 判定 问题 都 是 NP 问题 ， 因 为 这 两 个 问题 的 验证 阶段 都 是 多 项 式 时 
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间 复 杂 度 的 。 实 际 上 ， 人 大 们 能 想到 的 许多 可 解 问题 都 是 NP 问 题 。 

一 个 有 名 的 不 是 NP 问题 的 判定 问题 是 停机 问题 (halting problem)。 停 机 问题 定义 如 下 : 
已 知 带 有 任意 输入 数据 的 任意 程序 ， 此 程序 能 终止 吗 ? 另 一 个 问题 是 一 阶 谓词 演算 可 满足 性 问 
Wi (first-order predicate calculus problem)。 这 两 个 问题 都 是 所 谓 的 不 可 判定 问题 (undecidable 
problems ) 。 

不 可 判定 问题 不 能 够 靠 猜测 和 验证 解决 。 尽 管 它们 是 判定 问题 ， 但 也 不 能 穷尽 验证 整个 解 
空间 来 解决 。 读 者 应 该 注意 在 布尔 逻辑 (Boolean logic) (或 者 叫做 命题 逻辑 (propositional 
logic)) 中 ， 一 个 指派 是 用 n 元 组 刻画 的 。 但 是 对 于 一 阶 谓词 演算 ， 指 派 不 是 有 界 的 ， 可 能 是 无 
限 长 的 。 这 就 是 说 为 什么 一 阶 谓词 演 算 不 是 NP 问题 。 这 足以 提醒 读者 不 可 判定 性 问题 甚至 比 
NP 问题 还 难 。 

可 以 更 清晰 地 说 ， 对 于 可 满足 性 问题 和 旅行 商 判定 问题 ， 解 的 数量 是 有 限 的 。 对 于 可 满足 
性 问题 可 能 有 2 个 指派 ， 对 于 旅行 商 判 定 问题 可 能 有 (xz 一 D)! 条 回路 。 所 以 ， 尽 管 这 些 问 题 很 难 ， 
但 它们 至 少 有 某 些 上 限 。 例 如 ， 对 于 可 满足 性 问题 ， 至 少 可 以 用 O(C0 时 间 复 杂 度 的 算法 解决 。 

可 是 ， 不 可 判定 问题 没有 上 限 ， 可 以 证 明 这 样 的 上 界 不 存在 。 直 观 地 说 ， 让 程序 运行 一 百 
万 年 ， 仍 然 不 能 得 到 任何 结论 ， 因 为 程序 在 下 一 步 停 机 是 完全 可 能 的 。 相 似 地 ， 一 阶 谓词 演算 
判定 问题 也 面临 同样 的 情况 。 假 设 程序 在 运行 了 很 长 时 间 之 后 ， 仍 未 得 到 空子 句 。 但 是 ， 要 产 
生 的 下 一 子 句 是 空子 句 是 完全 可 能 的 。 


8.5 库 克 定理 


在 本 节 介 绍 库 克 定 理 。 将 只 给 一 个 非 形式 化 的 证 明 ， 因 为 形式 化 的 证 明 非 常 复杂 。 库 克 定 
理 陈述 如 下 。 

库 克 定 理 当 且 仅 当 可 满足 性 问题 是 P 问 题 ， 那 么 NP= P。 

上 面 定 理 的 证 明 由 两 部 分 组 成 。 第 一 部 分 是 “如 果 NP = P， 那 么 可 满足 性 问题 是 PP 问题。 
此 部 分 是 显然 的 ， 因 为 可 满足 性 问题 是 NP 问题 。 第 二 部 分 是 “如 果 可 满足 性 问题 是 P 问 题 ， 那 
么 NP =P。” 这 是 库 克 定理 的 关键 部 分 ， 本 节余 下 的 内 容 将 详细 阐述 这 部 分 。 

现在 先 对 库 克 定理 的 本 质 进 行 解释 。 假 如 有 一 个 很 难 解 决 的 NP 问 题 4， 我 们 不 直接 解决 该 
问题 ， 而 是 生成 另 一 个 新 间 题 4'， 通 过 求解 4' 得 到 4 的 解 。 需 要 注意 每 个 问题 都 是 判定 问题 ， 
采用 的 方法 如 下 : 

d) 由 于 问题 A 是 NP 问题 ， 那 么 一 定 存 在 解决 该 问题 的 NP 算法 B。NP 算 法 是 非 确 定性 多 项 
式 算法 ， 它 实质 上 是 不 可 能 存在 的 ， 所 以 并 不 能 使 用 它 ， 但 是 ， 正 如 将 要 看 到 的 步骤 中 我 们 仍 
然 可 以 从 概念 上 使 用 算法 B。 . 

(2) 构造 对 应 于 B 的 布尔 公式 C， 使 得 C 是 可 满足 的 当 且 仅 当 非 确定 性 算法 B 成 功 终止 ， 并 返 
回 “yes”。 如 果 C 是 不 可 满足 的 ， 那 么 算法 B 将 不 成 功 终止 ， 并 返回 “no”。 

需要 提醒 一 点 的 是 ， 当 提 及 一 个 问题 时 ， 是 指 一 个 问题 的 实例 (instance)。 也 就 是 问题 有 
特定 的 输入 ， 否 则 不 能 说 算法 终止 。 

我 们 将 推迟 如 何 构 造 公式 C 的 讨论 ， 这 部 分 是 库 克 定理 的 关键 部 分 。 

(3) 在 构造 公式 C 后 ,暂时 忘记 原来 的 问题 A 和 非 确 定性 问题 B。 尽力 推 断 公 式 C 是 否 可 满足 。 
如 果 是 可 满足 的 ， 那 么 对 问题 A 的 回答 是 “yes”; 否则 ， 回 答 是 “no”。 这 么 做 是 由 于 在 步 了 又 
(2) 中 所 陈述 的 公式 C 的 属性 ， 也 就 是 ，C 是 可 满足 的 当 且 仅 当 B 成 功 终止 。 

一 切 都 是 美好 的 。 上 面 的 方法 似乎 表明 只 需 关注 可 满足 性 问题 。 例 如 ， 我 们 不 必 知 道 如 何 
解决 旅行 商 判 定 问题 ， 只 要 知道 如 何 确定 相对 应 旅行 商 问题 的 布尔 公式 是 否 可 满足 。 这 是 一 个 
严肃 的 大 问题 。 如 果 可 满足 性 问题 很 难 解决 ， 那 么 原来 的 旅行 商 问 题 也 很 难 解决 。 这 是 库 克 定 
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理 的 核心 ， 它 表明 ， 如 果 可 满足 性 问题 能 在 多 项 式 步 数 内 解决 ， 那 么 每 个 NP 问 题 也 可 在 多 项 
式 步 数 内 解决 ， 本 质 上 是 因为 上 面 的 方法 。 

读者 能 够 理解 上 面 的 方法 是 有 效 的 ， 当 且 仅 当 总 能 构造 来 自 与 非 确定 性 算法 B 的 布尔 公式 
C， 使 得 C 是 可 满足 的 ， 当 且 仅 当 B8 成 功 终止 。 现 在 所 能 做 的 就 是 举例 说 明 。 

例 8-1 搜索 问题 的 布尔 公式 (情况 1) 

考虑 搜索 问题 。 已 知 n 个 数 的 集合 5 = {x(1)，x(2)，…，x(n)}， 要 确定 在 集合 5 中 是 否 存 在 
一 个 数 ， 比 如 说 7。 为 了 使 讨论 简单 ， 假 定 n = 2, x(1)=7，x(2) 半 7。 

非 确定 性 算法 表示 如 下 : 

i=choice(1, 2) 

if x(i) = 7 then SUCCESS 

else FAILURE. 


相对 应 于 上 面 非 确定 性 算法 的 布尔 公式 如 下 : 


i=l V i=2 
& i=l > i+2 
& i=2 一 i#l 
& xl)=7&i=1 —-SUCCESS 
& x(2)=7&i=2 —SUCCESS 
& xI)*7&i=1 —FAILURE 
& x(2)#7&i=2 —FAILURE 
& FAILURE —>—SUCCESS 
& SUCCESS (保证 成 功 终止 ) 
& xD=7 (输入 数据 ) 
& = x(2)#7 (输入 数据 ) 
为 便于 讨论 ， 将 上 面 的 公式 转换 成 合 取 范 式 : 
i=l V i=2 (1) 
i#] V i#2 (2) 
x(1) #7 V i#1 V SUCCESS (3) 
x(2)#7 V ix2 V SUCCESS (4) 
x(1)=7 V i#l V FAILURE (5) 
x(2)=7 V i#2 V FAILURE (6) 
—FAILURE V —SUCCESS (7) 
SUCCESS (8) 
x(1)=7 (9) 
x(2) #7 (10) 


上 面 的 子 句 集 是 通过 “& ”连接 的 ， 暂 且 名 略 。 由 于 下 面 的 赋值 满足 所 有 的 子 句 ， 所 以 它 
们 是 满足 的 : 


i=1 满足 (1) 

ix2 满足 (2)，(4) 和 (6) 
SUCCESS 满足 (3)，(4) 和 (8) 
—FAILURE 满足 (7) 
x(1)=7 满足 (5) 和 (9) 


x(2)#7 满足 (4) 和 (10) 
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正如 所 看 到 的 ， 现 在 所 有 的 子 句 都 可 满足 。 上 面 满足 所 有 子 句 的 赋值 也 可 通过 构造 语义 树 


来 找到 ， 如 图 8-8 所 示 。 

从 语义 树 上 可 以 看 到 。 仅 有 的 满足 所 
有 子 句 的 赋值 正 是 前 面 已 给 出 的 。 

我 们 已 证 明 该 公式 是 可 满足 的 。 为 什 
么 能 推断 非 确定 性 搜索 算法 将 成 功 终止 
We? 这 是 由 于 下 面 的 事实 : 这 个 公式 描述 
了 非 确定 算法 的 执行 ， 有 一 个 特定 的 子 句 
SUCCESS， 坚 持 算法 成 功 终止 。 

证 明 上 面子 句 集 的 可 满足 性 不 仅 告 诉 
我 们 算法 将 成 功 终止 并 返回 “yes”,， 而且 
回答 为 什么 是 “yes” 的 原因 ， 这 在 赋值 中 
可 以 找到 。 在 赋值 中 ， 有 一 个 文字 

i=l 
它 构造 解 。 也 就 是 ， 我 们 不 仅 知 道 搜索 会 
成 功 回答 “yes”， 也 明白 搜索 因为 x(1) = 7 
而 成 功 。 

这 里 需要 强调 成 功 地 将 搜索 问题 转换 
为 一 个 可 满足 性 问题 。 不 过 ， 人 们 对 于 这 
种 转换 并 不 激动 ， 因 为 直到 今天 可 满足 性 
问题 还 是 很 难 解决 。 

例 8-2 搜索 问题 的 布尔 公式 (情况 2) 

在 例 8-1 中 ， 说 明了 一 个 非 确定 性 算法 
可 以 成 功 终止 。 在 本 例 中 ， 将 说 明 非 确定 
性 算法 将 失败 终止 。 在 这 种 情况 下 ， 相 对 
应 的 布尔 公式 是 不 可 满足 的 。 





FAILURE 


(7) 


x(2) = 7 


(10) 





SUCCESS —SUCCESS 


(6) 0) 
图 8-8 一 颗 语义 树 


仍然 使 用 搜索 问题 作为 例子 。 为 了 简化 讨论 ， 假 定 ” = 2， 并 且 两 个 数 都 不 等 于 7， 那 么 布 


尔 公式 将 包含 下 面 的 子 句 集 ; 

i=l V i=2 (1) 
ix] V ix2 (2) 
x(1)#7 V i#l V SUCCESS (3) 
x(2)#7 V i#2 V SUCCESS (4) 
x(1)=7 V i+] V FAILURE (5) 
x(2) =7 V ix2 y FAILURE (6) 
SUCCESS (7) 
—SUCCESS V —FAILURE (8) 
x(1)#7 (9) 
x(2)#7 (10) 

上 面 的 子 句 集 是 不 可 满足 的 ， 通 过 使 用 消解 原理 很 容易 证 明 。 
(9)&(5) i#l V FAILURE (11) 
(10)&(6) ix#2 V FAILURE (12) 
(7)&(8) | —FAILURE (13) 
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#8 2 
(13)&(11) i+] (14) 
(13)&(12) i#2 (15) 
(14)&(1) i=2 (16) 
(15)&(16) LJ (17) 
上 面 对 空 子 句 的 推导 可 转换 成 类 英语 式 的 证 明 ， 或 许 会 很 有 意思 :: 
(1) 由 于 x(1) 冯 7 和 i = 1! 强 含 着 FAILURE，x(1) 不 必 等 于 7， 所 以 可 得 
i= 1 蕴含 着 FAILURE (11) 
(2) 类 似 地 ， 可 得 
i = 228 & FAILURE (12) 
(3) 由 于 我 们 要 主张 SUCCESS， 即 要 得 到 
—FAILURE (13) 
(4) 所 以 ， 噬 不 能 是 1 也 不 能 是 2. (14)&(15) 
(5) 可 是 ，i 古 1 或 者 是 2。 如 果 i; 不 是 1， 那 么 i 必 是 2. (16) 
(6) 导出 矛盾 。 
例 8-3 ”搜索 问题 的 布尔 公式 (情况 3) 
将 再 次 修改 例 8-1， 使 两 个 数 都 等 于 7。 对 于 这 种 情况 ， 将 有 下 面 的 子 句 集 : 
i=] V i=2 (1) 
i+] V i#2 (2) 
x(1)+7 V ix] V SUCCESS (3) 
x(2) #7 V i#2 V SUCCESS (4) 
x(1)=7 V ix] V FAILURE (5) 
x(2) =7 V i 基 2 V FAILURE (6) 
SUCCESS (7) 
-SUCCESS V -FAILURE (8) 
x(1)=7 (9) 
x(2)=7 (10) 


构造 语义 树 如 图 8-9 所 示 。 
在 上 面 的 证 义 树 路 ， 能 够 看 到 有 两 个 赋值 满足 上 面 的 所 有 子 句 集 。 一 个 赋值 是 i = 1, A 
个 是 i=2。 
例 8-4 可 满足 性 问题 的 布尔 公式 (情况 1) 
本 例 说 明 将 上 面 的 思想 对 应 于 可 满足 性 问题 ， 也 就 是 对 可 满足 性 问题 ， 可 以 构造 一 个 布尔 
公式 ， 使 原来 的 可 满足 性 问题 可 以 回答 “yes” 求 解 ， 当 且 仅 当 构造 的 布尔 公式 是 可 满足 的 。 
考虑 下 面 的 子 句 集 ; 
Xx, (1) 
TX : (2) 
我 们 将 尽力 确定 上 面 的 子 句 集 是 否 可 满足 ， 解 决 这 个 问题 的 非 确定 性 算法 如 下 : 
Do i=l, 2 
x,=choice(T, F) 
如 果 x Fx ih E FOA), ALASUCCESS, AMFAILURE, 
我 们 将 说 明 该 算法 如 何 转换 成 布尔 公式 。 首 先 ， 我 们 知道 非 确定 性 算法 依次 以 SVCCESS 
终止 ， 必 须 使 子 名 (和 (2) 为 真 。 所 以 ， 
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~SUCCESS V Ci 二 (1) | (SUCCESS =c, =T & c, =T) 
—SUCCESS V =T (2) 
一 C1 =T V x =T (3) (c =T>x =T) 
—c =T V X=F (4) (c, = T+—x, = F) 
y=T V n=F 0) 
x, =T V 2 =F (6) 
x 天 全 V x, #+F (7 
XET V xX, AF (8) 
SUCCESS, (9) 





图 8-9 一 棵 语义 树 
很 容易 理解 下 面 的 指派 满足 所 有 的 子 句 。 


ci = 了 满足 (1) 
cz = 了 满足 (2) 
x 二 了 满足 (3) 和 (5) 
x =F WE (0 和 (6) 
x #F 满足 (7) 
x, #T ae (8) 


SUCCESS 满足 (9) 
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所 以 ， 子 句 集 是 可 满足 的 。 

例 8-5 可 满足 性 问题 的 布尔 公式 (情况 2) 

在 例 8-4 中 ， 说 明 构 造 的 公式 是 可 满足 的 ， 因 为 原来 的 公式 是 可 满足 的 。 如 果 以 不 可 满足 
的 子 句 集 开 始 ， 那 么 对 应 的 公式 一 定 也 是 不 可 满足 的 ， 这 个 事实 可 通过 下 面 的 例子 说 明 。 

考虑 下 面 的 子 句 集 : 


XI (1) 
=x] (2) 
对 于 上 面 的 子 句 集 ， 可 构造 下 面 的 布尔 公式 : 
~SUCCESS V c =T (1) 
—SUCCESS V c =T (2) 
~c,=T Vo x =T (3) 
=c, =T V x =F (4) 
x =T V x =F (5) 
x 天 了 V xX, 天 下 (6) 
SUCCESS (7) 
上 面 的 子 句 集 是 不 可 满足 的 可 通过 使 用 消解 原理 得 到 证 明 ; 
(1) & (7) c=T (8) 
(2) & (7) c,=T (9) 
(8) & (3) x,=T (10) 
(9) & (4) x,=F (11) 
(10) & (6) x, #+F (12) 
(11) &(12) Cj (13) 


当 转 换 非 确 定性 算法 为 布尔 公式 时 ， 要 小 心 对 应 的 布尔 公式 一 定 不 包含 指数 量 级 的 子 句 ， 
否则 ， 这 个 转换 将 是 无 意义 的 。 例 如 ， 假 定 转换 含有 n 个 变量 的 可 满足 性 问题 为 含有 2" 个 子 句 
的 集合 ， 那 么 ， 这 个 转换 本 身 是 一 个 指数 级 的 过 程 。 

为 了 强调 这 一 点 ， 接 着 考虑 另 一 个 例子 (参看 例 8-6)。 

例 8-6 ”顶点 覆盖 判定 问题 

已 知 图 G = (V，E)， 在 V 中 的 顶点 集 5 称 为 图 G 的 一 个 顶点 覆盖 (node cover) ， 如 果 每 一 条 
边关 联 8 中 的 某 个 顶点 。 

考虑 图 8-10。 对 于 此 图 ，$8 = {vy2} 是 一 个 顶点 21 2 
书 盖 ， 由 于 每 条 边 都 关联 到 结 点 wz。 

顶点 履 盖 判定 问题 (node cover decision v1 v2 v3 
problem) Æ: 已 知 图 G = (VY， 包 和 一 个 正 整 数 ， 图 8-10 一 个 图 
确定 是 否 存 在 图 G 的 一 个 顶点 覆盖 5 使 得 | S 1<k。 

上 面 的 问题 可 以 由 非 确定 性 算法 解决 。 然 而 ， 该 非 确定 性 算法 不 能 试探 V 的 所 有 子 集 ， 由 
于 这 样 的 子 集 个 数 是 指数 级 的 。 但 是 ， 可 以 使 用 下 面 的 非 确定 性 算法 : 令 1V1=n, 1E1=m。 

Begin 

i, = choice({1, 2, ©, n}) 
i = choice({1, 2, ++, n}—{i,}) 


i, = choice({1, 2, ©, n}~{is i, oy kap) 
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For j := 1 to m do 
Begin 
If e 没有 关联 多 中 的 某 个 顶点 (1<r< 朋 
then FAILURE; 终止 


End 
SUCCESS 
End 
考虑 图 8-10， 并 有 生 假 定 x = 1。 在 这 种 情况 下 ， 有 下 面 的 子 句 集 ， 其 中 wk eee We RK, 
i=l V 站 =2 V i,=3 d) 
L#l V v, Ee, V FAILURE (2) 
i,#1 V v, Ee, V FAILURE (3) 
i, #2 V weEe V FAILURE . (4) 
i, #2 V v, Ee, V FAILURE . 6) 
i, #3 V v; Ee, V FAILURE (6) 
i, #3 V v; Ee, V FAILURE (7) 
v, Ee, (8) 
v, Ee, (9) 
v, Ee, (10) 
v; Ee, (11) 
SUCCESS (12) 
—SUCCESS V —FAILURE (13) 
下 面 的 指派 满足 上 面 的 子 句 集 : 
ii=2 满足 (1) 
v, Ge, 满足 (2) 和 (8) 
v, Ee, We (4) 和 (9) 
WEe, 满足 (5) 和 (10) 
Ee 满足 (7) 和 (11) 
SUCCESS 满足 (12) 
—FAILURE 满足 (13) 
i,#1 满足 (3) 
i, #3 满足 (0) 


由 于 子 句 集 是 可 满足 的 ， 则 顶点 覆盖 判定 问题 的 回答 是 YES， 其 解 是 选择 顶点 v2。 

从 上 面 的 非 正 式 描述 ， 可 以 明白 库 克 定理 的 意义 。 对 每 个 NP 问题 4， 可 以 转换 对 应 于 该 NP 
问题 的 NP 算法 B 为 布尔 公式 C， 使 得 公式 C 是 可 满足 的 当 且 仅 当 B 成 功 终止 并 返回 答案 “yes”, 
进一步 说 ， 花 费 多 项 式 步 数 完成 这 个 转换 。 所 以 ， 如 果 能 够 在 多 项 式 步 数 内 确定 布尔 公式 C 的 
可 满足 性 ， 那 么 可 明确 对 问题 4 的 回答 是 “yes” 还 是 “no"。 或 者 ， 可 以 等 价 地 说 ， 如 果 可 满 
足 性 问题 在 多 项 式 步 数 内 可 以 解决 ， 那 么 每 个 NP 问 题 可 在 多 项 式 步 数 内 解决 。 另 一 种 说 法 是 : 
如 果 可 满足 性 问题 在 P 中 ,那么 NP =P。 

注意 ， 库 克 定 理 是 在 一 个 约束 下 有 效 : 北 费 多 项 式 步 数 转换 NP 问题 为 对 应 的 布尔 公式 。 
如 果 花 费 指数 步 数 来 构造 对 应 的 布尔 公式 ， 那 么 库 克 定理 是 不 成 立 的 。 

另 一 个 要 点 是 ， 尽管 能 够 构造 描述 原 问 题 的 布尔 公式 ， 仍 不 能 容易 地 解决 原 问 题 ， 因 为 布 
尔 公式 的 可 满足 性 并 不 容易 确定 。 注 意 ， 在 证 明 一 个 公式 可 满足 时 ， 我 们 一 直 在 找 满足 该 公式 





184 区 8 章 





的 指派 。 这 项 工作 等 价 于 找 原 问题 的 解 。 非 确定 性 算法 不 负责 任 地 忽略 了 需要 找到 解 的 时 间 ， 
只 是 说 肯定 总 做 出 正确 的 猜测 。 而 解决 可 满足 性 问题 的 确定 性 算法 不 能 忽略 找到 指派 的 时 间 。 
库 克 定理 表明 ， 如 果 在 多 项 式 时 间 内 找到 满足 布尔 公式 的 指派 ， 那 么 ， 可 以 在 多 项 式 时 间 内 真 
下 猜测 到 正确 解 。 遗 憾 的 是 ， 直 到 现在 ， 我 们 并 不 能 在 多 项 式 时 间 内 找到 指派 。 央 此 ， 不 能 在 
多 项 式 时 间 内 正确 猜测 。 

库 克 定理 提醒 我 们 在 所 有 NP 问 题 中 可 满足 性 问题 是 非常 难 的 问题 ， 如 果 它 能 在 多 项 式 时 
问 内 解决 ， 那 么 所 有 的 NP 问题 都 能 在 多 项 式 时 间 内 和 解决。 但是， 在 NP 问题 中 ， 可 满足 性 问题 
是 具有 此 属性 的 唯一 问题 吗 ? 我 们 将 看 到 在 这 样 的 意义 下 ， 有 一 类 问题 等 价 于 另 一 类 问题 ， 即 
如 果 所 有 问题 能 在 多 项 式 时 间 内 解决 ， 那 么 所 有 NP 问 题 也 能 在 多 项 式 时 间 内 解决 。 这 类 问题 
称 为 NP 完 全 问题 (NP-complete problem) ， 在 下 一 节 将 讨论 这 些 问 题 。 


8.6 NP 完 全 问题 


定义 ”假设 4, 和 A; 是 两 个 问题 ， 当 且 仅 当 通过 使 用 解决 4 的 多 项 式 时 间 算 法 ，4 能 在 

多 项 式 时 间 内 解决 ， 那 么 称 人 4 规约 到 4， (写作 4, <A). 

从 上 面 的 定义 可 知 ， 如 果 4, ~ 4:， 并 且 有 解决 4 的 多 项 式 时间 算 法 ， 那 么 有 解决 4 的 多 项 
式 时 间 算 法 。 

使 用 库 克 定理 ， 每 个 NP 问 题 都 可 规约 到 可 满足 性 问题 ， 因 为 总 是 首先 通过 解决 对 应 于 布 
尔 公式 的 可 满足 性 问题 来 解决 NP 问题 。 

例 8-7 n 元 优化 问题 

考虑 下 面 的 问题 ,已 知 正 整 数 C(C>1) 和 正 整 数 +， 确 定 是 否 存 在 正 整 数 c;/,，c，，…，c,， 使 


fy I]« =C, H 6 最 小 。 称 这 样 的 问题 为 元 优化 问题 (n-tuple optimization problem) , 


现在 考虑 有 名 的 质数 问题 ， 它 确定 一 个 正 整 数 C 是 否 质 数 。 显 而 易 见 ， 下 面 的 关系 成 立 : 
质数 问题 < 2 元 优化 问题 。 原 因 是 显然 的 ， 在 解决 了 "元 优化 问题 之 后 ， 可 验证 解 c,，c>， 
ci 当 且 仅 当 存在 唯一 的 c 且 不 等 于 1， 而 其 他 所 有 的 c 都 等 于 1，C 是 质数 。 这 个 验证 过 程 只 花 
费 n 步 ， 所 以 是 多 项 式 过 程 。 总 之 ， 如 果 n 元 优化 问题 能 在 多 项 式 时 间 内 解决 ， 那 么 质数 问题 也 
能 在 多 项 式 时 间 内 解决 。 

直到 目前 ，n 元 优化 问题 仍 不 能 用 任何 多 项 式 时 间 算 法 解决 。 

例 8-8 ” 装 箱 问题 和 桶 分 配 问题 

考虑 装 箱 判定 问题 (bin packing problem) 和 桶 分 配 判定 问题 (bucket assignment decision 
problem ) 。 

装 箱 判定 问题 定义 如 下 : 已 知 n 个 物品 的 集合 ， 将 它们 放 进 B 个 装 箱 中 。 每 个 装 箱 的 容量 > 
C， 每 个 物品 需要 c; 个 单位 的 空间 。 装 箱 判 定 问题 是 确定 是 否 能 划分 这 n 个 物品 为 k (1<k<B) 
组 ， 使 得 每 组 物品 能 够 放 入 一 个 装 箱 中 。 

ihn, lc Ca G, ce) = (l, 4，7，4)，C = 8 及 B = 2， 我 们 可 以 划分 这 些 物品 为 两 组 : 
物品 1 和 3 在 一 组 ， 物 品 2 和 4 在 一 组 。 

如 果 (c1/，c;，c3，c4) = (1，4，,，8，4), C = 8，B =2， 那 么 没有 方法 能 划分 这 些 物 品 为 两 组 
或 一 组 ， 使 得 每 组 物品 能 放 入 装 箱 中 而 不 超过 装 箱 的 容积 。 

桶 分 配 判定 问题 定义 如 下 : 已 知 用 一 个 关键 字 做 标记 的 x 个 记录 ， 关 键 字 假定 是 4 个 不 同 的 
值 ; Vi, Va, vhs 并 有 n; 个 记录 对 应 于 vy， 也 就 是 nl +n t+ +n =n, 桶 分 配 判 定 问题 是 确 
定 是 否 能 将 这 a 个 记录 放 入 # 个 桶 中 ， 以 致 具有 相同 v 的 记录 在 一 个 桶 中 ， 并 且 没 有 桶 容纳 超过 
C 个 记录 。 
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例如 ， 令 关键 字 值 为 &， b, cud, Mas nps Res na = (1， 4, 2, 3), k=2 有 C= 5, 那么 将 
这 些 记 录放 入 如 下 两 个 桶 中 : 


桶 1 桶 2 
a C 
b C 
b d 
b d 
b d 


WME, My, no na) = (2，4，2，2)， 那 么 在 不 超过 每 个 桶 容量 的 情况 下 没有 方法 分 配 这 
些 记 录 到 桶 中 ， 使 同一 个 桶 有 同样 的 关键 字 值 。 

桶 分 配 判 定 问题 是 个 有 趣 的 问题 。 如 果 记 录 存 在 磁盘 上 ， 那 么 桶 分 配 判 定 问题 相关 于 最 小 
化 磁盘 存 取 次 数 问题 。 当 然 ， 如 果 要 最 小 化 磁盘 存 取 的 总 次 数 ， 应 该 把 同样 关键 字 的 记录 尽 可 
能 放 入 同一 个 桶 中 。 

很 容易 证 明 装 箱 问 题 能 规约 到 桶 分 配 判定 问题 。 每 个 能 在 多 项 式 时 间 步 数 内 产生 的 装 箱 问 
题 都 对 应 一 个 桶 分 配 判 定 问 题 。 所 以 ， 如 果 有 解决 桶 分 配 判定 问题 的 多 项 式 算法 ， 那 么 能 在 多 
项 式 时 间 内 解决 装 箱 问 题 。 

从 “规约 到 ”的 定义 可 容易 地 得 到 : 如 果 4, A, AA, IBAA ~ A;。 

有 了 “规约 到 ”的 定义 ， 现 在 能 够 定义 NP 完全 问题 。 

定义 ”如果 A E NP， 且 每 个 NP 问题 规约 到 4A， 那么 问题 A 是 NP 完全 的 。 

从 上 上 面 的 定义 ， 如 果 A 是 NP 完全 问题 ， 并 且 能 在 多 项 式 时 间 内 解决 ， 那 么 每 个 NP 问题 能 够 
在 多 项 式 时 间 内 解决 。 显 然 ， 由 于 库 克 定理 ， 可 满足 性 问题 是 NP 完全 问题 。 

根据 定义 ， 如 果 任 何 NP 完 全 问题 能 在 多 项 式 时 间 内 解决 那么 NP =P, 

可 满足 性 问题 是 发 现 的 第 一 个 NP 完全 问题 。 随 后 ，R. Karp 证 明了 21 个 NP 完全 问题 ， 这 些 
NP 完全 问题 包括 顶点 覆盖 ， 反 馈 弧 集 问题 (feedback arc set) ， 哈 密 顿 回路 等 。 在 1985 年 ， 
Karp 获 得 了 图 灵 奖 。 

为 了 证 明 一 个 问题 4 是 NP 完 全 的 ， 不 必 证 明 所 有 NP 问 题 都 规约 到 4。 这 是 库 克 在 证 明 可 请 
是 性 问题 的 NP 完 全 性 时 所 做 的 。 现 在 ， 只 使 用 “规约 到 ”的 传递 属性 。 如 有 果 4 是 一 个 NP 完 全 
问题 ，As 是 一 个 NP 问题 ， 并 且 能 证 明 A1~A,， 那 么 A 也 是 一 个 NP 完全 问题 。 这 个 推理 是 相当 
直接 的 。 如 果 A 是 一 个 NP 完全 问题 ， 那 么 所 有 NP 问题 可 规约 到 A。 如 果 A~B8B， 那 么 由 于 “规约 
到 ”的 传递 属性 ， 所 有 NP 问题 可 规约 到 B， 所 以 8 一 定 是 NP 完全 的 。 

在 上 面 的 讨论 中 ， 我 们 做 下 面 的 陈述 : 

(1) 可 满足 性 问题 在 所 有 NP 问 题 中 是 最 难 的 问题 。 

(2) 在 证 明 一 个 问题 4 的 NP 完 全 性 时 ， 我 们 经 常 尽力 证 明 可 满足 性 问题 可 规约 到 4。 因 此 ， 
显然 4 比 可 满足 性 回 题 难 。 

为 了 明白 这 里 的 陈述 没有 了 矛盾， 要 注意 每 个 NP 问 题 可 规约 到 可 满足 性 问题 。 所 以 ， 如 果 
我 们 对 一 个 NP 问 题 4 感 兴趣 ， 那 么 ， 当 然 4 可 规约 到 可 满足 性 问题 。 然 而 ， 这 里 必须 强调 : 说 
一 个 问题 4 规约 到 可 满足 性 问题 根本 不 重要 ， 因 为 它 只 意味 着 可 满足 性 问题 比 4 难 得 多 ， 这 已 
是 很 好 接受 的 事实 。 如 果 成 功 地 证 明 可 满足 性 问题 可 规约 到 4， 那 么 4 甚至 比 可 满足 性 问题 更 
困难 ， 这 是 更 重要 的 陈述 。 注 意 4< 可 满足 性 问题 ， 并 且 可 满足 性 问题 <4。 所 以 ， 只 要 关注 
困难 程度 ，4 等 价 于 可 满足 性 问题 。 

可 以 扩展 上 面 所 有 NP 完 全 问题 的 主题 。 如 果 4 是 一 个 NP 完 全 问题 ， 那 么 根据 定义 每 个 NP 
问题 ， 比 如 B， 可 规约 到 A。 如 果 进 一 步 通 过 A xB 证 明 B 是 NP 完全 的 ， 那么 4 和 B 是 相互 等 价 的 。 
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总 之 ， 所 有 NP 完 全 问题 形成 一 个 等 价 类 。 

注意 ， 我 们 限定 NP 和 问题 是 判定 问题 。 现 在 通过 定义 “NP 困难 性 ”(NP-hardness) 扩展 NP 
完全 性 概念 到 优化 问题 。 一 个 问题 4 是 NP 难 的 ， 如 果 每 个 NP 问题 可 规约 到 A。( 注 意 4 不 必 是 
NP 问题 。 实 际 上 ，A 和 可 以 是 一 个 优化 问题 ,) 所 以 ， 如 果 4 是 NP 难 的 ， 并 且 4 是 一 个 NP， 那 么 
问题 是 NP 完 全 的 。 通 过 这 条 途径 ， 优 化 问题 是 NP 难 的 ， 如 果 它 对 应 的 判定 问题 是 NP 完 全 的 。 
例如 ， 旅 行商 问题 是 NP 难 的 。 


8.7 证 明 NP 完 全 性 的 例子 


在 本 节 中 将 证 明 许多 问题 都 是 NP 完全 的 。 我 们 提醒 读者 要 证 明 问题 4 是 NP 完全 的 ， 通 常 做 
下 面 两 步 ; 

(1) 首先 证 明 4 是 NP 问题 ， 

(2) 然后 证 明 某 个 NP 完全 问题 可 规约 到 A。 

许多 读者 错误 地 证 明 4 可 规约 到 某 个 NP 完全 问题 。 这 是 毫 无 意义 的 ， 因 为 根据 定义 ， 每 个 
NP 人 问题 可 规约 到 每 个 NP 完全 问题 。 

注意 ， 直 到 目前 ， 我 们 只 接受 可 满足 性 问题 是 NP 完全 的 。 为 了 产生 更 多 NP 完全 的 问题 ， 必 
须 从 可 满足 性 问题 开始 。 也 就 是 说 ， 应 该 尽力 证 明 可 满足 性 问题 可 规约 到 我 们 感 兴趣 的 问题 上 。 

例 8-9 3 可 满足 性 问题 

3 可 满足 性 问题 (3-satisfiability problem) 类 似 于 可 满足 性 问题 ， 但 有 更 多 的 限制 : 每 个 子 
名 恰好 包含 三 个 文字 。 

显然 ，3 可 满足 性 问题 是 NP 问 题 。 为 了 证 明 它 是 NP 完 全 问题 ， 需 要 证 明 可 油 足 性 问题 可 规 
约 到 3 可 满足 性 问题 。 我 们 将 证 明 ， 对 每 个 任意 布尔 公式 FI， 可 以 生成 另 一 个 布尔 公式 F,， 在 
公式 中 的 每 个 子 身 恰好 包含 三 个 文字 ,使 得 Fl 是 可 满足 的 当 且 仅 当 书 是 可 满足 的 。 

首先 从 一 个 例子 开始 。 考 虑 下 面 的 子 句 集 : 





x, V XX, (1) 
=X; (2) 
可 以 扩展 上 面 的 子 句 集 ， 使 现在 每 个 子 集 包含 三 个 文字 : 

xX Vox» V Jj (1)! 
Xi V yY V ¥3 (2)' 


可 以 看 到 (1)&(2) 是 可 满足 的 ，(1)'&(2)' 也 是 可 满足 的 。 但 是 ， 上 面 增加 新 文字 的 方法 可 能 
产生 问题 ， 比 如 看 到 下 面 的 情况 : 


x (1) 
=x, (2) 
(D&(2) 是 不 可 满足 的 。 如 果 增 加 任意 一 些 新 文字 到 这 两 个 子 句 中 : 

x Vow yV a» (1)' 
=X Voy V ya (2)' 
(D'&(2)' 成 为 可 满足 的 。 


上 面 的 讨论 表明 不 能 任意 增加 新 文字 到 公式 中 ， 而 不 影响 其 可 满足 性 。 我 们 能 够 做 的 是 添 
加 新 的 子 句 ， 而 它们 本 身 对 于 原来 的 子 句 集 是 不 可 满足 的 。 如 果 原 子 句 集 是 可 满足 的 ， 那 么 新 
的 子 句 集 也 将 是 可 满足 的 。 如 果 原 子 句 集 是 不 可 满足 的 ， 那 么 新 的 子 句 集 也 将 是 不 可 满足 的 。 
如 果 原 子 句 只 包含 一 个 文字 ， 我 们 可 以 增加 下 面 的 子 句 集 : 
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yi V X2 
yi V y2 
Yi V 一 > 
=y; V 一 》> 
例如 ， 假 如 原子 句 是 x,， 那 么 新 生成 的 子 句 将 是 : 
XI V yı V y2 
xy V yi V 》2 
x, V Yı V 一 > 
xı V 一 yi V =y 
如 果 原 子 句 包含 两 个 文字 ， 可 以 增加 
Yı 
=y 
例如 ， 假 定 原子 句 是 
x, V X 
那么 新 生成 的 子 句 将 是 
x) V X2 V Yı 
x, V X V -y, 
考虑 下 面 的 不 可 满足 子 句 集 : 
Xi (1) 
一 Xi (2) 
现在 我 们 有 
xy V yı V y2 
x) V =y; V y2 
x, V yi V =y 
x V 一 V Ye ? 
Xi V y3 V Y4 
X V 一 y3 V Ya 
=x] V Y3 V 一 y4 
=x] V y; V 一 y4 
这 新 的 子 句 集 仍 是 不 可 满足 的 。 


如 果子 句 含有 多 于 三 个 的 文字 ， 可 通过 增加 下 面 的 不 可 满足 子 句 集 将 该 子 句 分 成 一 个 新 子 
句 集 : 


yı 
Ty V y2 
=y V Y3 
TY- V yi 

—y, 


考虑 下 面 的 子 句 : 
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h8 
x; V =X; V x; V Xa V —Xs 
可 以 增加 新 的 变量 以 生成 只 包含 三 个 文字 的 新 子 句 : 
xX, V =x; V yı 
X; V —y, V yə 
Xa V =X; V =y 


我 们 可 以 总 结 转换 子 名 到 恰 包含 三 个 文字 子 句 集 的 规则 。( 下 面 所 有 的 y 表示 新 的 变量 。) 
(D 如 果子 句 只 包含 一 个 文字 L,， 那 么 生成 下 面 的 四 个 子 句 : 


L, V yı V Y2 
Li V 一 》 V y2 
L, V yi V -y2 
Li V 一 多 V 一 yz 
(2) 如 果子 名 包含 两 个 文字 L, 和 L,， 那 么 生成 下 面 的 两 个 子 句 : 
L, V L, V yi 
Lı V L, V 一 多 


(3) 如 果子 句 包含 三 个 文字 ， 那 么 什么 也 不 作 。 
(4) 如 果子 句 包 含 多 于 三 个 文字 ， 那 么 如 下 生成 新 子 句 : BEXFEL, La c, Le BA 
新 子 句 是 


L, V L, V yi 
L; V 一 yy V y2 
Ly V L, V 一 yk-3 
考虑 下 面 的 子 句 集 : 
XI V Xy 
—x, 
x, V =x V x; V —X4 V Xs 
现在 生成 下 面 的 子 句 集 : 
x, V 和 V yi 
x, V X, V =y; 
—X, V y2 V ys 
=X; V =y, V y 
X3 V y2 V 一 六 
=X; V =y V ~y; 
x V 一 了 2 V Ya 
X; V 一 y4 V ys 
=X; V Xs V =y; 


正如 前 面 所 指出 的 ， 上 面 的 转换 必须 保持 原子 句 集 的 可 满足 属性 。 也 就 是 ， 令 5 表示 原子 
旬 集 ，S' 表 示 转 换 后 的 子 名 集 ，5' 中 每 个 子 旬 含 有 三 个 文字 ， 那 么 5' 是 可 满足 的 当 且 仅 当 5 是 可 
满足 的 。 这 将 在 下 面 证 明 。 

(1) 第 一 部 分 ， 如 果 5 是 可 满足 的 ， 那 么 S' 是 可 满足 的 。 其 中 /表示 满足 5 的 一 个 指派 ， 那 么 ， 
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显然 满足 包含 不 超过 三 个 文字 的 子 旬 生 成 的 所 有 子 句 。 令 C 是 一 个 在 5 中 含有 超过 三 个 文字 的 
子 句 ， 且 T(C) 是 在 S$' 中 与 C 相 关 的 子 句 集 。 例 如 ， 对 于 
C =x Vx V —x3 V x4 V —xXs 
XV VY, 
T(C) = 47% Vy V» 
X4 V -X5V 一 


如 同 假设 的 ?满足 C。 如 果 1 也 满足 T(C)， 我 们 已 做 。 否 则 ，1 必 须 至 少 满足 T(C) 的 一 个 子 集 。 
现在 解释 /怎么 能 扩展 到 1'"， 使 1 满足 T(C) 中 的 所 有 子 句 。 这 可 解释 如 下 : 令 C; 是 T(C) 中 一 个 1 满 
足 的 子 句 ， 赋 值 子 句 C 的 最 后 文字 为 假 ， 这 样 的 赋值 将 满足 TCC) 中 另 一 个 子 名 C;。 如 果 T(C) 中 
每 个 子 句 都 满足 ， 我 们 已 做 ， 否 则 ， 赋 值 子 句 C 的 最 后 文字 为 假 ， 此 过 程 可 重复 直到 每 个 句子 
都 满足 。 

考虑 C = x, Va Va VXV Xso 


T(C) fe: 
XI V X2 V Yı (1) 
x3 V 一 多 V y2 (2) 
Xa V Xs V 一 > (3) 


假如 7 = {x,}， 则 1 满足 (1)。 我 们 赋值 (1) 中 的 y 为 假 。 因 此 ,了 = {x -y IDATA E 
进一步 赋值 (2) 中 的 y, 为 假 ， 这 最 终 使 (3) 满 足 ， 所 以 ，I'= {x,， 一 1/， 一 y} 满 足 所 有 的 子 句 。 

(2) 第 二 部 分 : 如 果 5' 是 可 满足 的 ， 那 么 5 是 可 满足 的 。 对 于 5'， 新 添加 的 子 句 本 身 是 不 可 
满足 的 。 所 以 ， 如 果 5' 是 可 满足 的 ， 那 么 满足 5' 的 赋值 只 不 包含 y;， 它 必须 对 某 原始 变量 x 赋值 
真 。 考 虑 5' 中 子 旬 和 集 5;,， 它 是 对 应 于 通过 5 中 的 句子 C 生 成 的 。 由 于 满足 5 的 任何 赋值 一 定 满足 
至 少 C, 中 的 一 个 文字 ， 这 样 的 赋值 满足 C)。 所 以 ， 如 果 5' 是 可 满足 的 ， 那么 9 也 是 可 满足 的 。 

由 于 要 花费 多 项 式 时 间 转 换 任 意 子 句 集 5 为 子 句 集 S'， 每 个 5' 中 的 子 句 都 含有 三 个 文字 ， 并 
且 是 可 满足 的 当 且 仅 当 5 是 可 满足 的 ， 我 们 推断 ， 如 果 能 在 多 项 式 时 间 内 解决 3 可 满足 性 问题 ， 
那么 也 可 在 多 项 式 时 间 内 解决 可 满足 性 问题 。 因 此 ， 可 满足 性 问题 规约 到 3 可 满足 性 问题 ， 而 
且 3 可 满足 性 问题 是 NP 完全 的 。 

在 上 面 的 例子 中 , 证 明了 3 可 满足 性 问题 是 NP 完全 的 。 可 能 许多 读者 在 这 一 点 上 心 存疑 惑 ， 
即 根据 下 面 错 误 的 推断 ，3 可 满足 性 问题 只 是 可 满足 性 问题 的 一 种 特殊 情况 。 由 于 可 满足 性 问 
题 是 一 个 NP 完 全 问题 ， 则 3 可 满足 性 问题 自然 也 是 NP 完 全 问题 。 

一 般 问题 的 特殊 情况 的 难度 是 不 能 通过 验证 一 般 问题 来 推导 的 。 考 虑 可 满足 性 问题 ， 它 是 
NP 完全 的 ， 但 可 满足 问题 的 特殊 情况 不 是 NP 完全 的 ， 是 完全 可 能 的 。 考 虑 每 个 子 句 只 含有 正 
文字 的 情况 ， 也 就 是 ， 没 有 负 号 出 现 。 一 个 典型 的 例子 如 下 : 


X4 V Xs 

Xe 

在 本 例 中 ， 满 足 性 赋值 可 通过 赋值 每 个 变量 为 7 很 容易 得 到 。 因 此 ， 这 个 可 满足 性 问题 的 
特例 不 是 NP 完 全 的 。 

一 般 来 说 ， 如 果 问 题 是 NP 完 全 的 ， 它 的 特例 可 能 是 也 可 能 不 是 NP 完 全 的 。 另 一 方面 ， 如 
果 一 个 问题 的 特例 是 NP 完全 的 ， 那 么 该 问题 是 NP 完全 的 。 

例 8-10 色 数 判定 问题 
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本 例 将 证 明 色 数 判定 问题 (chromatic number decision problem) 是 NP 完 全 的 。 色 数 判 定 问 
题 定义 如 下 : 已 知 图 G = (VY，E)， 对 每 个 顶点 着 色 ， 如 果 两 个 顶点 有 一 条 边 连 接 ， 那 么 这 两 个 
顶点 一 定 要 着 不 同 的 颜色 。 色 数 判定 问题 是 确定 能 否 使 用 k 种 颜色 对 所 有 顶点 着 色 。 

考虑 图 8-11 。 对 于 该 图 ， 使 用 三 种 颜色 对 该 图 着 色 如 下 : 

4 一 |]，p 一 2，C 一 1，d 一 2，e 一 3 


考虑 图 8-12， 很 容易 明白 需要 四 种 颜色 着 色 。 


a b a b 


e e 
图 8-11 一 个 3 可 着 色 图 图 8-12 一 个 4 可 着 色 图 


为 了 证 明 色 数 判定 问题 是 NP 完 全 的 ， 需 要 一 个 NP 完 全 问题 证 明 该 NP 完 全 问题 可 规约 到 色 
数 判定 问题 。 在 本 例 中 ， 采 用 例 8-9 中 讨论 过 的 一 个 类 似 3 可 满足 性 的 问题 。 该 问题 是 可 满足 性 
问题 ， 它 的 每 个 子 名 至 多 含有 三 个 文字 。 由 于 例 8-9 的 讨论 ， 很 容易 明白 每 个 子 句 具 有 最 多 三 
个 文字 的 可 满足 性 问题 也 是 NP 完全 的 。 对 任意 的 一 个 可 满足 性 问题 ， 总 是 可 以 转换 为 一 个 可 
满足 性 问题 ， 该 问题 的 每 个 子 句 具有 最 多 三 个 文字 ， 而 不 影响 原 问题 的 可 满足 性 。 当 然 要 将 多 
于 三 个 文字 的 子 句 分 成 只 含有 三 个 文字 的 子 句 。 i 

现在 证 明 每 个 至 多 含有 三 个 文字 的 子 句 可 满足 性 问题 可 规约 到 色 数 判定 问题 。 本 质 上 要 证 
明 每 个 子 句 至 多 含有 三 个 文字 的 可 满足 性 问题 可 构造 一 个 对 应 的 图 , 使 原 布尔 公式 是 可 满足 的 ， 
当 且 仅 当 所 构造 的 图 能 用 n+ ! 种 颜色 着 色 ， 其 中 "是 出 现在 布尔 公式 中 的 变量 数 。 

令 x， 刀 ，…， 罗 标记 布尔 公式 下 中 的 变量 ， 其 中 z 关 4。 如 果 n<4， 那 么 是 常数 ， 可 满足 性 
问题 可 很 容易 地 确定 。 令 C1,，C;，…，C, 是 子 句 ， 每 个 子 句 至 多 含有 三 个 文字 。 

对 应 于 布尔 公式 的 图 G 依 据 如 下 的 规则 构造 : 

(1) AGEMAN, X 0s Xo TX TX s Vin Yoo yn Ci, Ca os Cro 

(2) 图 G 的 边 通过 如 下 的 规则 形成 ， 

(a) 对 于 1<i<n， 在 每 一 对 x 和 一 Xx; 之 间 有 一 条 边 。 

(b) 如 果 i 三 j，1<i,，j<n， 那 么 在 每 一 对 y, 和 ly 之 间 有 一 条 边 。 

(c) 如 果 i 二 j，1 <i,j<n， 那 么 在 每 一 对 yx 之 间 有 一 条 边 。 

(d) 如 果 i 短 j，1 <i,，j<n， 那 么 在 每 一 对 y; 和 一 x 之 间 有 一 条 边 。 

(e) 如 果 x; 锋 C，1<i<n，1<j<r， 那 么 在 每 一 对 x 和 Cj 之 间 有 一 条 边 。 

(f) 如 果 一 x; 儿 Cl，，1<isn，1<j<r， 那 么 在 每 一 对 -x 和 Cj 之 间 有 一 条 边 。 
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现在 证 明 F 是 可 满足 的 当 且 仅 当 G 是 n+ 1 可 着 色 的 ， 该 证 明 由 两 部 分 组 成 : 

(1) 如 果 F 是 可 满足 的 ， 那 么 G 是 n+ 1 可 着 色 的 。 

(2) 如 果 G 是 n + 1 可 着 色 的 ， 那 么 F 是 可 满足 的 。 

首先 证 明 第 一 部 分 。 假 定 F 是 可 满足 的 。 在 这 种 情况 下 ， 可 以 选择 任何 满足 F 的 指派 A， 按 
如 下 方式 对 顶点 着 色 : 

(1) 对 所 有 的 y，y 用 颜色 ;着 色 。 

(2) 对 所 有 的 x 和 一 x;， 按 如 下 方法 进行 着 色 : 如 果 x; 在 4 中 赋值 为 T"， 那 么 x; 用 颜色 i 着 色 ， 
-用 颜色 2+ 1 着 色 ， 否 则 ，x 用 颜色 n+ 1 着 色 ， 一 x 用 颜色 i 着 色 。 

(3) 对 于 每 个 C;， 在 C 中 找 出 一 个 文字 L;， 其 在 4 中 为 真 。 由 于 A 满足 每 个 子 句 ， 所 有 对 于 所 
有 的 子 句 L; 存在 ， 分 配 C 与 此 文字 同样 的 颜色 。 也 就 是 ， 如 果 忆 是 xs， 那么 分 配 C 与 拓 同 样 的 颜 
色 ， 否则 ， 分 配 C; 与 -x 同样 的 颜色 。 


考虑 下 面 的 子 句 集 : 
xX, V x, V X; (1) 
X; V —Xa V Xa (2) 


着 色 图 如 图 8-13 所 示 。 

令 4 = (Xi, Xp, —Xy, X4), ABA, 赋值 
如 下 : 

xel, —x,—S 

X25, -x-2 

x5, —x,+-3 


x, —4, ~x; 5 


Cel (x EARR EC.) 

C,—3 (一 局 在 4 中 满足 C:。) 

为 了 证 明 上 面 的 着 色 是 合法 的 ， 可 以 进 
行 下 面 的 推理 

(1) 如 果 闻 户 那 么 每 个 w 都 连接 到 每 个 w。 
所 以 ， 没 有 两 个 yw 着 相同 的 颜色 ， 这 如 同 将 图 8-13 一 个 色 数 判定 问题 构造 的 图 
y 着 颜色 i 一 样 。 

(2) 每 个 x 连接 到 一 x;,， 所 以 和 一 x 不 能 着 相同 的 颜色 。 这 样 做 是 因为 没有 x 和 一 x 分 配 同 样 
的 颜色 。 此 外 ， 根 据 规则 没有 y; 与 x 或 -x 着 相同 的 颜色 。 

(3) 考虑 C;。 假 如 上 在 CG, 中 出 现 ，L 在 A 中 为 真 ， 那 么 C, 着 与 相同 的 颜色 。 只 有 特殊 的 -x 或 
x 等 于 L,， 那 么 所 有 的 x 和 一 x 将 着 与 C, 相 同 的 颜色 。 但 是 ，L, 不 能 连接 到 C)， 因 为 出 现在 Cj 中 。 
由 于 连接 到 C;， 所 以 没有 C 与 x 或 ~x 有 同样 的 颜色 。 

从 上 面 的 讨论 可 以 推断 ， 如 果 下 是 可 满足 的 ， 那 么 G 是 上 + 1 可 着 色 的 。 

现在 证 明 另 一 部 分 ， 如 果 G 是 n + 1 可 着 色 的 ， 那 么 是 可 满足 的 。 推 导 如 下 : 

(1) 不 失 一 般 性 ， 假 定 y; 着 以 颜色 i。 

(2) 由 于 x 与 x; 相 连接， 所 以 ，x; 与 x 不 能 分 配 相同 的 颜色 。 如 果 i 关 jj， 那 么 和 和 一 x 与 y 相 
连接 ， 所 以 或 者 x 用 颜色 i 着 色 ， 一 x, 用 颜色 n+ 1 着 色 ， 或 者 x: 用 颜色 i 着 色 ， 忆 用 颜色 n+ 1 着 色 。 

(3) 由 于 每 个 C/ 含 有 至 多 三 个 文字 以 及 >4， 所 以 至 少 有 一 个 ;使 5 和 一 上 都 不 出 现在 C 中 。 
| 因此， 每 个 CGC 连接 到 至 少 一 个 用 n+ 1! 着色 的 顶点 上 。 因 此 ， 没 有 C, 用 n + 1 着 色 。 

(4) 对 于 每 个 C,，1 <j<r。 如 果 C, 用 颜色 i 着 色 ，x; 用 颜色 i 着 色 ， 那 么 赋值 4 对 x 虐 值 为 真 。 
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如 果 Cj 用 颜色 i 着 色 ， 一 x; 用 颜色 i 着 色 ， 那 么 指派 A 对 x 指派 为 假 。 

(5) 需要 注意 C 用 颜色 i 着 色 ，x 和 一 x 无 论 哪 个 用 颜色 i 着 色 。 它 一 定 不 能 连接 到 x 或 -x;,， 这 
意味 着 用 颜色 i 着 色 的 文字 一 定 在 C, 中 出 现 。 在 4 中 ， 这 个 特殊 的 文字 指派 为 真 ， 所 以 满足 Cj。 
将 此 ，A 满 足 所 有 的 子 句 。 由 于 存在 至 少 一 个 指派 满足 所 有 的 子 名 ， 所 有 F 一 - 定 是 可 满足 的 。 

在 上 面 的 讨论 中 ， 我 们 证 明了 对 每 个 含有 至 多 三 个 文字 的 子 句 集 ， 可 以 构造 一 个 图 使 ?个 
变量 的 原子 句 集 是 可 满足 的 ， 当 且 仅 当 对 应 的 图 是 4 + ! 可 着 色 的 。 此 外 ， 很 容易 证 明 图 的 构造 
花费 了 多 项 式 步 数 。 所 以 ,每 个 子 铅 含有 至 多 三 个 文字 的 可 满足 性 问题 可 规约 到 色 数 判定 问题 ， 
色 数 判定 问题 是 NP 完 全 的 。 

在 本 节 的 剩余 部 分 中 ， 将 证 明 VLSI 离 散布 图 问题 (discrete layout problem) 是 NP 完全 的 。 
为 了 证 明 ， 首 先 必 须 证 明 其 他 一 些 问题 是 NP 完 全 的 。 

例 8-11 FRAZOM 

假定 集合 族 F = {S,, So e, SOMRATZ U, wm, o, UDRAS, BASE Ls. ™ 
iB (exact cover problem) 是 确定 是 否 有 一 个 TC F 的 互 不 相交 的 子 集 使 得 T 


Us = {Ui, U2, U} = Us, 
SE SiEF 


例如 ， 假 定 F = {(a,, ai), (a, a4), (4, a)}, BAT = (Cas, ai), (hr, qa)} 是 F 的 一 个 严 
RE. ERT PNRM RA ALE TA. MRF = {((a;, a), (ay, as), (Gr, a), BA 
没有 严格 覆盖 。 

现在 设法 证 明 这 个 严格 覆盖 问题 是 NP 完全 的 ， 通 过 将 着 色 问 题 规约 到 严格 覆盖 问题 得 到 。 
例 8-10 中 对 着 色 问 题 已 作 介绍 。 

令 已 知 在 着 色 问 题 中 的 图 顶点 集 是 Y = {vr v 7, Vb, WEE = {6 e, s e)s 以 
及 一 个 整数 k， 现 在 转换 这 个 着 色 问 题 实例 为 严格 履 盖 问题 实例 5={yj, vy， … ,VEn, Ei, …， 
En, En, En, oy Ex, ots Emo Enos os En}, 其 中 EE,， En, *…,， Ei 对 应 于 ei， l<i<m, 
并 且 子 集 族 已 = {Cr Cry ,Cys ts Crary Cao os Cars Dus Di, tts Dus ots Dms 
Dz，…，Dwx}。 每 个 Cj 和 Di; 都 是 根据 下 面 规 则 确定 ， 

(1) 如 果 边 e 以 顶点 v, 和 v, 作 为 终端 ， 那 么 对 d Hl, 2, 0, k, CFIC, MAE. 

(2) 对 所 有 的 二 WU，Dy = {E;}. 

(3) Mjal, 2, +, k, CME, 

举 一 个 例子 ， 考 虑 图 8-14。 

在 本 例 中 ，n = 4，m = 4。 假 如 = 3， 
FAAS = {vi, Vo, V3, Var En, En, Ens 
By, En, En, Es, Ex, E33, Es, Es, 
Ex}, F=l{Cy, Cir, Cis Cas Crs Crs, 
Cys Cary Cass Cas Car, Cas, Dus Dir» 
Dis Das Dns Daos Dy, Dy, Dyis Day, 
Da, Da}, 每 个 Dj 只 包含 一 个 E。 WFC, 
我 们 通过 例子 来 说 明 其 内 容 。 考 虑 e,， 它 连 
接 v, 和 v;。 这 意味 着 Cl, 和 Cs 都 含有 E'!/。 类 似 
地 ，Ci, 和 Cis 都 含有 El,。Ci 和 Ci; 都 含有 E';。 

整个 集合 族 F 构 造 如 下 : 

Cun={E, Ex, vid, 

Cro={Ei, En, vi}, 





V3 


图 8-14 说 明 着 色 问 题 到 严格 覆盖 问题 的 转换 图 
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Cas { En, En, vids 
Cy ={ Ey, En, vo}, 
Cy ={ En, En, v}, 
CaS { En En, v2}, 
Cas { En, Ey, Ey, vad, 
Cu ={ En, Ey, En, vids 
Ca = (Ey, Ey, En, Vat, 


Ca = { En, va), 
Cy = { Ep, Va}, 
Ca = { En, Va}, 


Dy, ={ Ey}, Ds={E,}, Dy={ En), 

Da = { Ey}, Dy ={ En}, Dn = { En}, 

Dy ={ Ey}, Dy={ Ev}, Dy ={ En), 

a = {Ey}, Dg= {En}, Da = { Eu}. 

我 们 忽略 着 色 问 题 是 k 可 着 色 的 当 且 仅 当 构造 的 严格 覆盖 问题 有 解 。 同 时 ， 通 过 实例 说 明 
这 种 转换 的 有 效 性 。 

图 8-14 是 3 可 着 色 的 。 使 y;,，v;，v; 和 vy, 分 别 着 色 1，2，3 和 和 1。 在 本 例 中 ， 选 择 Cl,，C,,， 
C3，Ca1，Di;，D;;，D;;: 和 Ds 作为 覆盖 。 首 先 很 容易 明白 它们 是 互 不 相交 的 ， 从 而 ， 集 合 5 严 
格 被 这 些 集合 履 盖 。 例 如 ，v,，v;， 包 和 v 分 别 被 Ci，C2;，C;3 和 Cs 所 覆盖，Ei 被 Ci 所 覆盖 ， 
Es 被 Cy 所 覆盖 ， 以 及 Ei; 被 D1, 所 覆盖 。 

这 个 可 规约 性 的 形式 化 证 明 留 做 练习 。 

例 8-12 子 集 和 问题 

子 集 和 问题 (sum of subsets problem) 定义 如 下 : 假定 数 的 集合 4 = {a,, a, 0, a, AH 
数 C， 确 定 是 否 存在 4 的 子 集 4'， 使 得 4' 中 元 素 相 加 为 C。 

例如 ， 令 A = {7，5，19，1，12，8，14} 和 常数 C 为 21， 那 么 这 个 子 集 和 问题 有 解 即 4' = 
{7，14}。 如 果 C 为 11 ， 那 么 该 子 集 和 问题 无 解 。 

可 通过 规约 严格 覆盖 问题 到 子 集 和 问题 来 证 明 该 问题 的 NP 完全 性 。 已 知 严 格 禾 盖 问 题 实例 
INF ={S,, Soy 7, S), ARRAS = (US, = {ww，w;，…，4}。 根 据 下 面 的 规则 构造 对 应 的 


子 集 和 问题 的 实例 ， 子 集 和 问题 实例 包含 集合 4 = (a, a, e ah, AP 
aj= Fend, 如 果 u; E S,, 那么 er = l; 否则 ep =0。 


Iim 


C= Fory =((n + 1)”—1)/n 


OKi<m 
同样 ， 将 上 面 转换 的 有 效 性 留 做 练习 。 
例 8-13 分 割 判 定 问题 
分 割 问题 (partition problem) 定义 如 下 : BAA = {a,, a, +, a}, a; 都 是 正 整数 。 
分 割 问题 是 确定 是 否 有 一 个 分 割 4 = {4,，42}， 使 得 


“EA ti EA? 


例如 ， 令 4 = {1，3，8，4，10}， 可 分 割 4 成 两 个 子 集 {1，8，4} 和 {3，10}。 很 容易 验证 
第 一 个 子 集中 元 素 和 等 于 第 二 个 集合 中 元 素 和 。 





194 #8 ž 





该 问题 的 NP 完 全 性 可 通过 规约 子 集 和 问题 为 该 问题 来 证 明 ， 如 何 证 明 也 留 做 练习 。 

例 8-14 装 箱 判定 问题 

之 前 介绍 的 装 箱 判 定 问题 描述 如 下 : 已 知 * 个 物品 的 集合 ， 每 个 大 小 < 是正 整 数 ， 还 已 知 正 
整数 B 和 C， 分 别 是 装 箱 个 数 和 装 箱 容积 。 确 定 能 否 分 配 物 品 到 k 个 装 箱 中 (1<k<B)， 使 所 有 
分 配 到 每 个 装 箱 中 的 物品 的 c; 之 和 不 超过 C。 

可 以 通过 规约 分 割 问题 到 该 问题 证 明 其 NP 完 全 性 。 假 如 分 割 问题 实例 有 4 = {a,, a, s a,}， 
可 通过 设 定 B8=2，c=a，1<is<sn 和 5C = Sa/2 来 定义 相应 的 装 箱 判 定 问 题 。 显 然 ， 装 箱 判 


定 问题 当 k=2 有 解 ， 当 且 仅 当 存 在 对 4 的 分 割 。 

例 8-15 VLSI 高 散布 图 问题 

在 本 题 中 ， 已 知 "个 矩形 的 集合 3y， 在 某 些 限制 下 ， 确 定 是 否 可 能 将 这 些 和 矩形 放 到 一 个 有 特 
定 面积 的 大 和 矩形 中 。 形 式 化 地 说 ， 已 知 4 个 矩形 的 集合 和 一 个 整数 4。 对 于 1 <i<n， 每 个 矩形 7 
有 长 、 宽 尺寸 5 和 w， (如 和 wi 为 正 整 数 )。VLSI 离 散布 图 问题 是 确定 能 否 在 该 平面 上 放置 这 些 逢 
K, 使得: 

(1) 每 条 边界 都 平行 于 某 一 系统 坐标 轴 。 

(2) 矩形 的 角 放 在 平面 的 整数 点 上 。 

(3) RAAT RG Be, 

(4) 两 个 矩形 的 边界 有 至 少 1 个 单位 长 度 间隔 。 

(5) 在 平面 中 有 一 个 矩形 确定 了 放置 其 他 人 盾 形 的 范围 ， 它 的 边界 平行 于 坐标 轴 且 有 至 多 为 4 
的 面积 。 确 定 范围 的 矩形 边界 允许 容纳 放置 矩形 的 边界 。 

图 8-15 所 示 为 一 个 成 功放 置 。VLSI 离 散布 图 问题 的 NP 完全 性 可 通过 证 明 将 装 箱 判 定 问题 


规约 到 VLSI 离 散布 图 问题 来 证 明 。 在 装 箱 判 | 





定 问题 中 ， 已 知 n 个 物品 及 每 件 物品 的 大 小 
是 c;， 装 箱 数 是 8， 以 及 每 个 装 箱 的 容量 是 C。 | 
对 于 装 箱 判定 问题 ， 构 造 VLS1 离 散布 图 问题 


如 下 : 
(1) 对 应 于 每 个 c;， 有 高 度 为 h; = 1 和 宽度 
L | 


— 1 he 一 一 





Wi = (2B + 1) c; 一 1 的 矩形 7。 

(2) 另外 ， 有 另 一 个 宽度 为 w = (2B + 
DC-1 和 高 度 为 = 2Bw + 1 的 矩形 。 

(3) 边界 的 矩形 面积 是 4 = w(h + 2B)。 图 8-15 一 个 成 功 的 放置 

首先 证 明 如 果 装 箱 判 定 问题 有 解 ， 那 么 构造 的 VLSI 离散 布 图 问题 也 有 解 。 假 定 对 装 箱 i， 
存放 其 中 物品 的 大 小 是 d,，da，…，d, 。 放 置 按 行 安排 对 应 的 矩形 ， 使 行 的 高 度 保持 为 1， 如 
图 8-16 所 示 。 如 果 使 用 k 个 装 箱 ， 那 么 将 有 k 行 高 度 为 1 的 矩形 。 然 后 在 这 些 行 下 放置 具有 宽度 
为 wv、 高度 为 4 的 矩形 ， 如 图 8-17 所 示 。 


1 (2B + 1)d,,- 1 ee (QB+ Dd 1 —» 1— (2B + Dd -1 — 


f 














图 8-16 特定 的 放置 行 
每 个 行为 的 ;个 矩形 ， 宽 度 可 按 如 下 方法 找到 : 
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S (28+ Nd, -1) +0,-1) 
aal ， 


ji 
= eBs($a,)-ii 
asl 


<(2B+ DC 一 ] 


w 


| pL] Le [sa eae 
1 < 对 应 十 装 箱 2 
一 下 


| 上 < 对 应 于 装 箱 人 








h=2Bw +1 





w—— w=(2B4+1IC-1 一 一 | 
图 8-17 n+ 1 个 矩形 的 放置 
所 以 ， 这 n+ 1 个 矩形 的 宽度 小 于 或 等 于 w， 而 对 应 的 高 度 小 于 (2K + h) <(2B + 加 。 放 置 这 
n+ 1 个 矩形 的 总 面积 因此 小 于 
(2B+h)w=A 
这 意味 着 如 果 装 箱 判 定 问题 有 解 ， 那 么 对 应 的 a + 1 个 矩形 可 放置 在 大 小 为 4 的 矩形 中 。 
现在 证 明 另 一 个 方面 。 假 定 成 功 在 一 个 大 小 为 4 = w(h + 28) 的 矩形 内 放置 了 n + 1 个 矩形 。 
证 明 原 装 箱 判定 问题 有 解 。 
主要 的 推理 是 成 功 地 放置 不 能 是 任意 的 ， 必 须 在 -一些 限制 下 ， 这 些 限制 如 下 : 
(1) 放置 的 宽度 必须 小 于 w + 1。 如 若 不 然 ， 由 于 有 一 个 高 度 为 的 矩形 ， 总 的 面积 将 大 于 
h(w+ 1) » | e 
=hw+h + 
=w(h+2B)+1 j 
=A+I1>A, 
这 是 不 可 能 的 。 
(2) 每 个 矩形 7 一 定 以 高 度 为 1 的 方法 放 b) 
置 。 换 名 话说 ， 和 矩形 ”必须 按 图 8-18a 方 式 放 图 8-18 放置 的 可 能 方式 
BA, ， 而 不 能 按 图 8-18b 方 式 放置 。 
如 若 不 然 ， 那 么 总 的 高 度 一 定 大 于 
h+(QB+ I)c;-1 41 
=h+(2B + lc, 


对 于 某 个 i， 在 这 种 情况 下 ， 总 的 面积 将 大 于 
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(h + (2B + Ic; )w 
= hw + 2Bc; w + we; 
= (2Bc, +h) w + we, 
2At+we; 
>A, 
这 是 不 可 能 的 。 
(3) an 个 矩形 所 占据 的 行 总 数 不 大 于 8B， 如 果 大 于 8B， 那 么 面积 将 大 于 
w(h + 2B)=A 
这 是 不 可 能 的 。 
基于 上 面 的 讨论 ， 我 们 很 容易 证 明 


yd, <C 

MD. BANGER ETIT A ke EE Pe RRMA. Ak, ix 
样 完 成 了 证 明 。 

例 8-16 简单 多 边 形 的 艺术 陈列 馆 问题 

在 第 3 章 提 到 的 艺术 陈列 馆 问题 定义 如 下 : 已 知 -一 个 艺术 陈列 馆 ， 需 配置 最 小 数量 的 警卫 ， 
使 艺术 陈列 馆 的 每 点 至 少 有 -一 名 警卫 监视 。 假 设 艺 术 陈 列 馆 以 简单 多 边 形 表示 。 因 此 ， 艺 术 陈 
列 馆 癌 题 也 可 定义 如 下 : 已 知 一 个 简单 多 边 形 ， 在 其 中 放置 最 小 数量 的 警卫 ， 使 得 简单 多 边 形 
的 每 点 至 少 有 一 名 警卫 监视 。 例 如 ， 考 虑 图 8-19 中 的 简单 多 边 形 ， 至 少 需要 三 名 警卫 。 

如 果 规 定 每 名 警卫 仅 放置 在 简单 多 边 形 的 顶点 上 ， 
那么 称 这 个 特殊 的 艺术 陈列 馆 问 题 为 最 小 顶点 警卫 问题 
(minimum vertex guard problem) 。 现 在 证 明 最 小 顶点 警 
卫 问 题 是 NP 难 的 。 艺 术 陈 列 馆 问 题 的 NP 难 度 可 以 类 似 
地 证 明 。 首 先 定义 顶点 警卫 判定 问题 如 下 : 已 知 有 7 个 
顶点 的 简单 多 边 形 已 ， 以 及 一 个 正 整 数 开 <P， 确 定 是 否 
存在 子 集 TCV， 并 且 | Ti<K、 以 致 在 T 中 每 个 顶点 放 一 
名 警卫 使 P 中 每 个 顶点 被 至 少 T 中 一 名 警卫 监视 到 。 图 8-19 简单 多 边 形 和 最 小 数目 的 警卫 

很 容易 明白 顶点 警卫 判定 问题 是 NP 的 ， 因 为 非 确定 性 算法 只 需 猪 测 有 K 个 顶点 的 子 集 V' CS 
V， 并 在 多 项 式 时 间 内 验证 是 否 在 V' 中 的 每 个 顶点 放 一 名 警卫 ， 使 得 在 多 边 形 的 每 点 能 被 那 名 
警卫 监视 。 为 了 证 明 该 判定 问题 的 NP 完全 性 ， 将 使 用 NP 完全 的 3 可 满足 性 (3SAT) 问题 。 

我 们 将 证 明 3SAT 问 题 是 多 项 式 可 规约 到 顶点 警卫 判定 问题 的 。 首 先 定义 可 区 分 点 如 下 : 
在 多 边 形 中 两 个 不 同 点 是 可 区 分 的 ， 如 果 它 们 不 能 从 多 边 形 中 的 任何 点 可 见 。 这 个 定义 在 后 面 
的 讨论 中 需要 。 为 了 从 给 定 的 3SAT 问 题 实例 构造 一 个 简单 多 边 形 ， 首 先 分 别 定义 对 应 于 文字 、 
子 句 和 变量 的 基本 多 边 形 。 这 些 基本 多 边 形 a 
可 组 合成 最 后 转换 的 简单 多 边 形 。 
文字 多 边 形 

对 于 每 个 文字 ， 构 造 多 边 形 如 图 8-20 所 
示 。 在 图 8-20 中 ， 点 记号 “.” 表 示 一 个 可 区 
分 的 点 ， 后 面 将 会 解释 ， 这 些 文字 多 边 形 以 
这 种 方式 安排 ， 将 在 最 后 的 简单 多 边 形 中 没 
有 点 能 被 两 者 看 到 。 容 易 看 到 只 有 a, 和 a; 能 图 8-20 文字 模式 子 多 边 形 
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看 到 此 完整 的 文字 多 边 形 。 在 一 个 3SAT 问 题 实例 中 ， 每 个 子 句 有 三 个 文字 。 所 以 ， 对 应 于 子 
名 的 每 个 多 边 形 将 有 二 个 这 样 的 文字 多 边 形 。 
子 名 多边形 

对 于 每 个 子 名 C, = AV BV DD， 构造 一 个 子 名 多边形 如 图 8-21 所 示 。 令 (ql/，q;，*…，qa,) 表 示 
a), a, 7, a, fel RARE, BBA, ER8-21p, REE Biss 8a) (Rare Bray Bar 
Birds (Bias Boss Anas Ams bras Bms dras dms Bros gm) 和 (gr, Birr Sido ESIR, gmo Eml = 
(Sins ga) 和 lg , Rw) = (Bios gaDl, 其 中 I(x，v)| 表 示 线段 (ux，v) 的 长 度 。 

在 子 名 多边形 中 有 一 些 重要 的 性 质 。 首 
E, 容易 看 到 没有 g,;，i = 1，2，…，7 能 看 
BIRT ESM. PLL, WATE E 
多 边 形 内 配置 警卫 。 注 意 在 任何 文字 多 边 形 
中 没有 配置 警卫 能 看 到 整个 完整 的 另外 是个 
文字 多 边 形 。 所 以 ， 我 们 需要 三 名 警 册 ， 人 在 
每 个 文字 多 边 形 中 配置 一 名 警卫 。 但 是 在 这 a 
些 文字 多 边 形 中 有 某 些 顶点 没有 配置 警卫 。 em 
ERERKEN, WUERM an ams bus aye ; 
bas dn, Qa} PRR BD, RAR /人 
合 。 推 理 如 政 : 

C) qs、bms 和 dns 中 没有 -个 能 看 到 三 个 
定 整 的 文字 多 边 形 ， 所 以 它们 不 能 是 候选 。 

(2) 考虑 文字 A 的 文字 多 边 形 。 如 果 选 择 as,， 那 么 无 论 如 何 对 文字 B 和 D 的 文字 多 边 形 配置 ， 
Alpama PRERE ELEA., KA, a MER. E, REM an, aw bao Bas dms 
dy HAREN. 

(3) 没有 两 个 顶点 从 同一 文字 多 边 形 中 选择 。 因 此 ， 从 {an ，ans，Pnt，bns， das dy HAE 
的 顶点 只 有 八 种 可 能 的 组 合 。 因为 {a;;，b;;，dis} 不 能 看 到 整个 Agj,giz8n;， 所 以 应 该 取消 。 这 
意味 着 只 有 七 种 可 能 的 组 合 ， 现 总 结 如 下 . 

性 质 1: 只 有 从 {fawny，am，bit，bi3，ds1，dis} 中 选择 顶点 的 七 种 组 合 能 看 到 整个 子 名 多 

边 形 。 这 些 顶 点 的 七 种 组 合 是 ta bm, duds {ans Ons dats {ans Biss Ants {aps 

Diss dm}, {ans Pins da), (aay bms, dafam, Diss dito 
对 子 名 多边形 的 标记 机 制 1 

需要 注意 ， 每 个 文字 多 边 形 对 应 一 个 文字 。 在 子 句 中 文字 以 肯定 或 否定 出 现 。 然 而 ， 从 上 
面 对 文 字 多 边 形 构造 的 讨论 ， 我 们 似乎 没有 考虑 文字 的 符号 。 这 有 些 迷 惑 。 实 际 上 ， 后 面 将 看 
到 ， 文字 的 符号 将 确定 该 文字 一 些 多 边 形 的 顶点 标记 ， 这 样 通过 考虑 顶点 的 符号 ， 对 变量 真 什 
的 指派 将 确定 警卫 在 哪里 配置 。 

装 虑 文字 4， 其 他 情况 是 类 似 的 。 对 于 文字 4， 必 须 在 a 或 a 配置 一 名 警卫 。 如 果 A 是 肯定 
(否定 )， 那 么 标记 顶点 ai(an3) 为 T， 顶 点 aiy(an1) 为 F， 参 见 图 8-22。 如 果 变 量 指派 为 真 假 )， 
那么 在 标记 为 T(F) 的 顶点 配置 警卫 。 这 意味 着 顶点 asi(as) 表 示 对 文字 4 的 指派 为 真 〔 假 )。 

现在 用 一 个 例子 解释 标记 机 制 、 真 值 指派 和 最 终 警 卫 配置 之 间 的 关系 。 考 虑 情况 C, = 
UV 一 WV us， 图 8-23 显 示 对 此 情况 的 标记 。 

考虑 满足 指派 ， 比 如 


Bh Literal A 





Literal B 


Literal D 


图 8-21 子 句 结 C =4VBVD 


uT, uF, uy—-T 
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a) PA =u, b) XTA = —u, 
图 8-22 对 子 句 交点 的 标记 机 制 1 
在 此 情况 下 ， 整 卫 将 配置 在 a,,、 by Ady) 以 此 种 方式 配置 警卫 将 不 能 看 到 整个 子 句 多 边 
形 。 考 虑 另 - 一 种 满足 指派 ， 比 如 
uT, mT, mF 
在 此 情况 下 ， 整 pH EEan. bida 以 
此 种 方式 配置 警卫 将 能 看 到 整个 子 句 多 边 形 。 最 
后 ， 考 虑 下 面 的 不 可 满足 性 指派 : 
u F, uT, mF 
在 此 情况 下 ， 警卫 将 配置 在 ai、 bn; 和 ds;。 以 
此 种 方式 配置 警卫 将 不 能 看 到 整个 子 句 多 边 形 。 
通过 仔细 地 验证 标记 机 制 1， 可 以 看 到 从 顶点 {fan， 
ano Bais Pass Anis dat HARRA PHE an, 
by，di3} 符 合 不 可 满足 的 真 值 指派 在 子 句 中 出 现 。 








所 以 ， 有 下 面 的 性 质 ， 图 8-23 对 子 句 交点 C,= WV 一 Vw 的 标记 
竹 质 2 ， 子 句 C, 的 子 句 多 边 形 从 文字 多 边 形 的 机 制 1 的 例子 
三 个 顶点 可 见 ， 当 且 仅 当 对 应 顶点 标记 的 真 值 构成 对 子 句 C, 的 可 满足 性 指派 。 


变量 多 边 形 ti 
对 每 个 变量 构造 一 个 变量 多 边 形 ， 如 图 8- t ` 
24m. RATA CU, liss bes bga)o TEAt tits 
FETE RT LAA, EEA RAE, tos tas 
tiss teita] WN 
我 们 已 描述 了 子 名 多边 形 和 变量 多 边 形 。 
现在 描述 如 何 合并 它们 成 为 问题 实例 多 边 形 。 
问题 实例 多 边 形 的 构造 
步骤 1. 将 变量 多 边 形 和 子 句 多 边 形 放 在 一 
起 ， 如 图 8-25 所 示 。 有 下 面 的 事实 : | 
(1) 顶点 w 除 了 Atitats 外 ， 可 见 n 个 变量 多 边 图 8-24 n HORE SAY 
Æ, i=l, 2, --, 7, 
(2) (w, Biss Bier Boss Zas “ts Emso Smo AM (ts Eass Saar Sate VEN, hk = 1, 
2, <, Mo 
步骤 2, 用 尖峰 增加 变量 多 边 形 。 假 设 变量 出 现在 子 句 CGC 中， 如 果 u 在 子 句 C; 中 肯定 出 现 ， 
那么 如 图 8-26a 所 示 的 两 个 尖峰 Pg AD rs Ean, tss Ps DFG. te r, VANE. ute Fy 
CGC 是 否定 出 现 的 情况 显示 在 图 8-26b 中 。 





hia tn 
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1 个 变 最 多 边 形 
图 8-25 合并 变量 多 边 形 和 子 名 多边形 





a) b) 
图 8-26 增加 尖峰 


步骤 3. 用 多 边 形 代替 尖峰 。 由 于 增加 的 尖峰 P9 和 rs 是 线段 ， 在 步骤 2 完成 后 没有 得 到 简 
单 的 多 边 形 ， 所 以 按 如 下 方法 用 多 边 形 代替 尖峰 。 我 们 将 在 图 8-26 a 中 解释 这 种 情况 ， 图 8-26b 
是 类 似 的 。 在 图 8-26a 中 ， 用 阴影 区 域 代替 pg 和 痕 如 图 8-27a 所 示 ， 得 到 (as ，i，P，9，(an， 
e, f), (aps tgs T, S)FNMan3, u, V)o 也 就 是 ， 我 们 得 到 Aa,af 和 Aajssv。 在 图 8-27 中 所 产生 的 
多 边 形 称 为 一 致 性 检验 多 边 形 (consistency-check polygon)。 一 致 性 检验 的 含义 将 在 后 面 解释 。 





图 8-27 通过 称 为 一 致 性 检验 模式 的 小 区 域 代替 每 个 尖峰 
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变量 多 边 形 标记 机 制 2 

对 于 变量 多 边 形 u;， 顶 点 iis 和 ti 总 是 分 别 标 记 和 T， 如 图 8-27 所 示 。 如 果 u 指 派 真 〔 假 )， 
那么 在 标记 为 (A) 的 顶点 配置 -~ 名 警卫 。 

再 次 考虑 图 8-27a。 在 此 情况 下 ，u; E C， 有 两 种 配置 方法 ， 一 名 警卫 配置 在 文字 多 边 形 ， 
-名 警卫 配置 在 变量 多 边 形 。 

F = (u, V u, V —u,) A (~u, V —u, V u) 

它们 是 ta ，ts} 和 {ans，tis}。 第 一 种 情况 对 应 于 给 指派 真 ， 第 二 种 情况 对 应 于 给 4 指派 假 。 

图 8-28 中 是 从 3SAT 人 公式 = (u, V u, V =u) A (~u, Vu V 3) 中 构造 完全 简单 多 边 形 。 加 点 
表示 警卫 。 在 此 情况 下 ， 最 小 警卫 数 为 10。 根 据 标记 机 制 1 和 2， 警 卫 的 配置 模式 对 应 于 

uT, wF, u-T 


_ -u Vu, vu 
UI V u, V -u 1 2% 4% 


















u, — false 


ae ee 
A f; i + ae ; Fidi + aa “ue 
KANG uy < true 
u ay a 


u, < true 
图 8-28 由 3SAT 公 式 构造 的 简单 多 边 形 的 例子 
现在 我 们 证 明 下 面 主要 的 结论 。 
断言 1; 已 知 子 句 集 5， 如 果 5 是 可 满足 的 ， 那 么 需要 监视 整个 问题 实例 5 的 多 边 形 最 小 的 项 
点 数 是 K=3m+n+1。 
可 进行 如 下 推理 : 如 果 5 是 可 满足 的 ， 那 么 在 5 中 出 现 的 变量 有 真 值 指派 ， 使 得 在 这 种 指派 
下 每 个 子 句 C; 为 真 。 如 果 w 指 派 为 真 ， 那 么 在 相对 应 w 的 变量 多 边 形 1 配 置 一 名 警卫 ， 在 相对 应 
文字 多 边 形 的 an 或 au 配置 一 名 警卫 ， 这 要 分 别 依 赖 于 4 还 是 -4 在 Co 中 。 如 果 x% 指 派 为 假 ， 那 么 
在 相对 应 的 变量 多 边 形 t; 配 置 一 名 警卫 ， 在 相对 应 文字 多 边 形 的 qi 或 a 配置 一 名 警卫 ， 这 要 
分 别 依赖 于 一 u 还 是 在 C; 中 。 因 此 ， 对 于 通过 一 致 性 检验 多 边 形 和 文字 多 边 形 定义 的 多 边 形 ， 
根据 标记 机 制 1 和 2， 需 要 配置 3m + n 名 敖 卫 来 监视 。 对 于 通过 变量 多 边 形 定义 的 剩余 和 矩形， 我 
们 只 需要 在 顶点 w 放 置 一 位 警卫 来 监视 。 所 以 ， 我 们 需要 K = 3m + n+ 1。 
断 青 2: 已 知 子 句 集 5， 如 果 最 小 警卫 数 为 K=3m + n+1， 那 么 5 是 可 满足 的 。 
这 部 分 的 证 明 比 较 复 杂 。 首 先 断 言 w 是 必须 选 的 ， 否 则 ， 由 于 在 个 变量 多 边 形 中 ，2n 个 算 
形 中 的 每 -- 个 必须 配置 警卫 ， 所 以 至 少 需要 3m + 1 个 顶点 。 因 此 ， 下 面 只 考虑 剩余 的 K 一 1 = 3m 
+ hn 个 顶点 。 
在 构造 简单 多 边 形 时 ，3m 个 文字 多 边 形 中 的 每 个 都 有 可 区 分 的 点 ，n 个 变量 多 边 形 也 有 。 
因此 ， 在 简单 多 边 形 中 有 3m + mr 个 可 区 分 的 点 。 我 们 知道 没有 监视 可 区 分 点 的 顶点 能 监视 任何 
其 他 可 区 分 点 。 那 么 ， 至 少 需要 3m + n 个 顶点 来 监视 3m + n 个 可 区 分 点 。 
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我 们 不 能 任意 选择 3m + 2 个 点 ， 否 则 ， 它 们 不 能 监视 剩余 的 简单 多 边 形 。 下 述 实际 上 将 证 
明 它 们 必须 选择 ， 以 致 对 应 于 满足 $ 的 变量 的 真 值 指派 。 将 这 样 的 警卫 放置 模式 称 为 是 -- 致 的 ， 
它 的 定义 如下: 

Riou REE, uRARAGEEMAC,, Cr, 0, CP, xy, X, oo, 是 从 1 在 C， 
Cro, C POR MIF FS WAAR, XR {x a, e, uhe BA, WRE BMRA 
THA, uM EES WAM TX AK: 

(1) 48 FS 4 NEN ZARA ESB REM AX, POAT LR, 

(2) APPA RAM —-RSX,, EREDAR MPLA RT HG, 


EM, UO REF AGRA TLR EH ue Ch -u€ C, ueC, 
的 . 

例如 ， 考 虑 图 8-29。 假 定 变量 ww 分 别 以 肯 Y 如 
定 (tu)、 否 定 (一 加 和 肯定 (zj) 出 现在 子 名 C、 NE Rn RG 
C 和 C, 中 。 如 果 选 择 顶 点 cr ，yw 和 zw， 由 于 E e 、 
剩余 的 矩形 能 从 这 三 个 变量 监视 ， 并 且 右 侧 Le g 
的 第 形 根本 监视 不 到 ， 所 以 变量 多 边 形 相对 gt 


于 这 个 顶点 集 是 一 致 的 。 类 似 地 ， 对 应 4 的 顶 
ARER, CHH Trn Yilni AÉ. 
hu ARHI, EAR Taxis, vz, 
ER RN, MF RFU) ESS HY ast F 





XR, MAX 3 BF tu HEPA, "hte 
如 果 它 相对 于 XX 不 一 致 ， 那 么 X 不 对 应 的 任 H 
何 真 值 指派。 图 8-29 一 致 性 概念 的 举例 


如 果 只 有 KK = 3m + n 个 顶点 ， 那 么 所 有 的 变量 多 边 形 一 定 与 文字 多 边 形 中 的 顶点 集 是 一 致 
的 。 在 U 的 任何 变量 多 边 形 L;， 一 致 检验 多 边 形 的 数量 依赖 于 ui 出 现在 子 抽 中 的 数量 。 假 定 这 
个 数 是 qg， 由 于 连接 到 上 左边 矩形 的 一 致 性 验证 多 边 形 的 数量 和 右边 多 边 形 的 数量 是 一 样 的 ， 
所 以 在 乙 中 一 致 性 验证 多 边 形 的 总 数量 是 24。 其 中 4 个 连接 到 一 个 抢 形 ， 或 者 左面 或 者 右面 。 
如 果 是 左 〈 右 )， 那 么 我 们 将 警卫 配置 到 ts(ra)。 因 此 ， 仅 需要 3m + n + 1 名 警卫 。 如 果 交 不 可 满 
足 ， 那 么 连接 到 左面 年 形 的 -一些 - 致 性 验证 多 边 形 与 连接 到 右面 矩形 的 一 些 一 致 性 验证 多 边 形 
就 不 能 从 任何 顶点 监视 。 所 以 ， 至 少 需要 3m + n+ 2 个 顶点 。 因 此 ，K = 3m + n + 1 要 求 所 有 的 
变量 多 边 形 对 于 文字 多 边 形 中 选择 的 顶点 是 一 : 致 的 。 

由 于 每 个 4 与 X 是 致 的， 那么 连接 到 它 的 年 形 之 一 的 - 致 性 验证 多 边 形 可 从 X; 中 的 顶点 
看 到 。 对 于 另 -… 个 引 形 ，-- 致 性 验证 多 边 形 或 者 在 i 或 者 在 is 可 看 到 。 此 外 ，iis 或 者 1s 也 可 视 为 
变量 多 边 形 的 可 区 分 点 。 这 意味 着 只 需要 一 个 顶点 监视 每 个 变量 多 边 形 ， 那 么 需要 7 个 顶点 监 
视 n 个 变量 多 边 形 。 为 此 ， 得 到 所 有 m 个 完整 的 子 句 多 边 形 ， 一 定 可 以 从 文字 多 边 形 选择 的 
3m tnt 1 一 (n+ 1 上 =3m 个 顶点 看 到 。 根 据 性 质 2， 每 个 子 句 的 三 个 顶点 将 对 应 于 出 现在 该 子 句 
变量 的 真 值 指 派 。 因 此 ，C 是 可 满足 的 。 

8.8 2 可 满足 性 问题 

在 本 章 中 ， 我 们 证 明了 可 满足 性 问题 是 NP 完全 的 ， 也 声明 了 当 一 个 问题 是 NP 完全 的 ， 它 
的 变种 不 必 也 是 NP 完全 的 。 为 了 强调 这 一 点 ， 我 们 将 证 明 2 可 满足 性 问题 (2-satisfiablility 
problem) 在 P 类 中 ， 这 相当 令 人 惊讶 。 

2 可 满足 性 问题 (2SAT) 是 可 满足 性 问题 的 特例 ， 在 每 个 子 句 中 只 有 两 个 文字 。 
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已 知 2SAT 问 题 实 例 ， 可 以 构造 一 个 有 向 图 ， 称 为 问题 实例 的 指派 图 (assignment graph), 
指派 图 构造 如 下 ， 如 果 在 问题 实例 中 x,，x,，…，x, 是 变量 ， 那 么 指派 图 的 结 点 是 Xx!，x,，…， 
和 一 x/， 一 Xx2，…，~X,。 如 果 有 子 旬 是 L, VL 形式 ， 其 中 上 ,和 LL 是 文字 ， 那 么 在 指派 图 中 ， 
从 一 L 到 L, 有 -一 条 边 ， 从 一 [到 IL 也 有 一 条 边 。 由 于 每 条 边 相 关 一 个 且 仅 有 一 个 子 旬 ， 我 们 可 用 
对 应 的 子 名 标记 每 条 边 。 


考虑 下 面 的 2SAT 辐 题 : 
XxX, V Xa 
Xə V X3 


上 面 2SAT 问 题 的 指派 图 如 图 8-30 所 示 。 

ETA) 一 x V X 

假定 指派 z, 为 T， 为 了 使 得 句子 为 T， 那 么 必须 指 
派 x, 也 为 T， 在 指派 图 中 由 从 x, 到 x 的 边 表 明 。 另 一 方 
面 ， 假 定 -指派 为 7， 为 了 使 得 句子 为 T， 那 么 必须 指 
派 一 x 也 为 T。 在 指派 图 中 由 从 一 x; 到 一 x 的 边 表明 。 这 
就 是 为 什么 每 条 子 句 有 两 条 边 ， 这 两 条 边 是 对 称 的 。 
也 就 是 ， 如 果 从 结 点 x 到 结 点 y 有 一 条 边 ， 那 么 从 -> 到 图 8-30 指派 图 
-x 也 会 有 - -条 边 。 每 条 边 对 应 满足 该 子 句 的 可 能 指派 。 

基于 上 面 的 推理 ， 有 下 面 对 指 派 图 中 的 顶点 指派 真 值 的 规则 

(1) 如 果 结 点 4 指派 为 T， 那 么 所 有 从 结 点 4 可 达 的 结 点 都 应 指派 为 7。 

(2) 如 果 结 点 4 指派 为 T， 那 么 结 点 -4 同时 指派 为 。 

例如 ， 考 虑 图 8-30。 如 果 指派 -为 T， 那 么 必须 指派 x, 和 元 都 为 T7。 同 时 ， 必 须 对 其 他 所 
有 结 点 指派 为 F， 如 图 8-31 所 示 。 一 种 以 上 能 满足 所 有 子 句 的 指派 图 指派 真 值 的 方法 是 可 能 的 。 
例如 ， 对 于 图 8-30， 可 以 指派 一 性 和 xz 为 T， x 为 F。 很 容易 明白 这 两 个 (一 x， 一 ，x 3) 和 (一 x，， 
x， 一 x) 都 满足 子 句 。 

因为 有 一 条 边 邻 接 结 点 4， 当 且 仅 当 变 量 A 在 子 句 中 出 现 ， 在 任何 时 候 结 点 A 指派 为 T， 所 
有 相对 于 邻接 结 点 A 的 边 将 都 是 满足 的 。 例 如 ， 假 定 在 图 8-30 中 结 点 总 指派 为 7， 由 于 边 邻 接 结 
点 已 对 应 于 子 名 1 和 2， 因 此 两 个 子 句 现在 都 是 满足 的 。 

考 虚 另 一 个 例子 ， 假 定子 句 是 

—x, V X (1) 

x V Xz (2) 








图 8-31 对 指派 图 指派 真 值 图 8-32 指派 图 
对 应 上 面 的 子 句 集 的 指派 图 如 图 8-32 所 示 。 在 本 例 中 ， 不 能 指派 一 x, 为 T。 如 果 那 样 的 化 ， 
会 遇 到 两 个 问题 : 
(1) x 和 一 x 都 将 指派 为 T， 因为 x, 和 一 x 都 是 从 一 x 可 达 的 ， 这 是 不 允许 的 。 
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(2) 由 于 一 x 指派 为 T， 那 么 x, 将 指派 为 T7。 这 最 终 导 致 *, 指 派 为 7， 这 也 是 不 允许 的 ， 因 为 不 
能 对 x, 和 x, 都 指派 为 7。 

但 我 们 可 以 对 x 指派 为 T， 满 足 如 图 8-32 所 示 的 子 句 1 和 2。 因 为 x, 可 指派 任意 值 。 在 关心 可 
满足 性 的 地 方 ， 对 指派 为 T 后 ，x 的 指派 不 再 重要 。 

孝 虑 下 面 的 例子 : 


x V X2 (1) 
xX] V X (2) 
x V X (3) 
=x] V x, (4) 


对 应 的 指派 图 如 图 8-33 所 示 。 

在 本 例 中 很 容易 看 到 对 于 图 中 结 点 没有 指派 真 值 
的 方法 。 每 个 指派 都 导致 矛盾 。 假 如 指派 为， 那么 
有 从 zx, 到 -x 的 路 径 ， 这 导致 x, 指派 为 Y。 假 如 指派 
一 为 T， 由 于 从 -到 xj 也 有 路 径 ， 致 使 x 指 派 为 7。 因 
此 ， 不 能 对 xn 指派 任何 真 值 。 

没有 办 法 对 此 图 中 的 结 点 指派 真 值 ， 这 决 非 偶然 
不 能 这 么 做 是 因为 该 子 句 集 是 不 可 满足 的 。 

-- 般 地 ，2SAT 子 揣 集 是 可 满足 的 当 且 仅 当 对 某 个 
x， 它 的 指派 图 中 不 能 同时 包含 从 x 到 一 x 的 路 径 和 从 一 on 
到 x 的 路 径 。 读 者 很 容易 了 解 图 8-33 的 指派 图 含有 这 样 omit 
的 路 径 ， 而 在 图 8-31 和 图 8-32 不 包含 这 样 的 路 径 。 

假定 在 指派 图 中 某 个 -:， 有 从 x 到 -x 的 路 径 和 从 -x 到 x 的 路 径 。 显然， 不 能 对 :指派 真 值 ， 因 
此 这 个 输入 子 句 一 定 是 不 可 满足 的 。 

假定 在 指派 图 中 所 有 x 不 存在 从 x 到 x 的 路 径 和 从 -x 到 x 的 路 径 。 将 证 明 这 样 的 输入 子 句 集 
一 定 是 可 满足 的 。 在 这 种 情况 下 推理 ， 可 以 对 指派 图 中 的 结 点 成 功 指派 真 值 。 下 面 给 出 用 于 发 
现 这 样 指派 的 算法 。 

步骤 1. 在 指派 图 中 选择 结 点 4， 它 没有 指派 真 值 ， 并 且 不 能 通 向 -4。 

步骤 2. 给 4 和 所 有 从 结 点 4 可 达 的 结 点 指派 真 值 ?， 对 每 个 结 点 x 指派 为 T， 结 点 -x 指派 为 F， 

DR 如 果 有 结 点 没有 指派 ， 转 向 步 又 1， 否 则 ， 退 出 。 

仍 有 一点 必须 注意 。 上 面 的 算法 对 于 某 个 +:， 是 否 导致 x 和 -x 都 指派 为 7 的 情况 ? 这 是 不 可 
能 的 。 如 果 结 点 y 通 向 结 点 r， 由 于 指派 图 的 对 称 性 ， 那 么 一 定 有 从 x 到 -y 的 边 。 因 此 ，y 是 这 
样 的 结 点 ， 将 通 向 ~_y。 所 图 8-34 所 示 ， 这 在 步 又 1 是 不 被 选择 的 。 

因为 对 于 所 有 的 x， 从 x 到 -x 的 路 径 和 从 x 到 x 的 路 径 不 同时 存在 。 在 算法 中 ， 总 是 有 结 点 
可 选 。 换 句 话说 ， 上 面 的 算法 总 是 可 以 产生 满足 输入 子 句 集 的 指派 。 因 此 ， 子 句 集 是 可 满足 的 。 

已 经 说 明 为 了 确定 2SAT 问 题 实例 的 可 满足 性 ， 只 需要 对 © © 
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x 的 路 径 。 这 等 价 于 确定 在 指派 图 中 是 否 存 在 x 一 … 一 一 x 一 … 

x 形式 的 坏 。 直 到 目前 ， 我 们 没有 讨论 如 何 设计 该 算法 。 对 、 
读者 来 说 ， 设 计 确 定 在 指派 图 中 是 否 存在 这 样 的 环 将 变 得 很 > 一 < ` 
j © © 


总 之 ，2SATI 一 个 P 回 题 。 
总 之 ，2SAT 问 题 是 一 个 P 问 题 图 8-34 指派 图 中 边 的 对 称 性 
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8.9 注释 与 参考 


在 计算 机 科学 领域 中 ，NP 完 全 性 的 概念 可 能 是 最 难 理解 的 概念 之 一 ， 涉 及 此 概念 的 最 重 
要 的 论文 是 Cook 在 1971 年 撰写 的 ， 它 证 明了 可 满足 性 问题 的 重要 意义 。 在 1972 年 ，Karp 证 明 
了 许多 组 合 问题 是 NP 完 全 的 〈Karp，1972)。 这 两 篇 论文 被 认为 是 里 程 碑 式 的 。 从 那 时 起 ， 大 
量 问 题 被 证 明 是 NP 完 全 的 。 由 于 有 大 量 这 方面 的 论文 ， 所 以 由 AT&T 的 David Johnson 维 护 这 方 
面 的 论文 数据 库 。 他 也 定期 为 关于 NP 完全 性 的 算法 学 报 撰写 文章 。 他 的 文章 都 以 “NP 完全 性 
GR: 持续 发 展 指南 ”为 题 ， 这 些 文章 对 算法 感 兴趣 的 计算 机 科学 家 是 非常 重要 和 有 意义 的 。 

完全 地 专心 致 志 于 NP 完 全 性 方面 非常 好 的 书 是 Garey and Johnson(1979)。 该 书 介 绍 了 NP 完 
全 性 的 发 展 历史 ， 一 直 作 为 NP 完全 性 方面 的 百科 全 书 。 在 本 书 中 ， 我 们 对 于 库 克 定理 没有 给 

出 正式 的 证 明 ， 这 是 一 个 痛苦 的 决断 。 我 们 认识 到 即使 给 出 正式 的 证 明 ， 对 于 读者 也 是 很 难 掌 
提 其 真正 含义 的 。 取而代之 ， 我 们 通过 例子 说 明 非 确定 型 算法 如 何 转 换 成 布尔 公式 ， 使 得 当 且 
仅 当 转换 的 布尔 公式 可 满足 ， 那 么 非 确定 型 算法 以 “yes” 终 止 。 库 克 定理 的 形式 证 明 可 在 最 
初 的 库 克 论文 (Cook, 1971) 中 找到 。 读 者 还 可 以 参考 ，Horowitz and Sahni (1978), Garey 
and Johnson(1979) 以 及 Mandrioli and Ghezzi(1987)。 

注意 对 于 NP 完全 性 只 是 最 坏 情 况 下 的 分 析 。 如 果 一 个 问题 是 NP 完全 的 ， 那 么 并 不 劝导 人 
们 研究 在 平均 情况 下 解决 该 问题 的 有 效 算 靶 。 例 如， 开发 了 许多 解决 可 满足 性 问题 的 算 靶 ， 它 
们 中 许多 是 基于 本 章 讨论 的 消解 原理 。 消 解 原 理 是 由 Robinson 所 发 明 (Robinson，1965)， 并 
在 文献 Chang and Lee(1973) 中 讨论 。 最 近 ， 找 到 了 几 个 在 平均 情况 下 是 多 项 式 的 可 满足 性 问题 
算法 (Chao, 1985; Chao and Franco, 1986, Franco, 1984; Hu, Tang and Lee, 1992, 
Purdom and Brown, 1985), 

另 一 个 有 名 的 NP 完全 问题 是 旅行 商 问 题 ， 可 通过 归 约 哈密 顿 回路 问题 到 旅行 商 问题 来 建 
立 其 NP 完全 性 (Karp，1972)。 有 一 本 专门 介绍 旅行 商 问题 的 书 (Lawler,，Lenstra，Rinnooy 
Kan and Shmoys，198S) 。 针 对 简单 多 边 形 的 艺术 陈列 馆 问 题 也 是 NP 完 全 的 〈Lee and Lin, 
1986) ， 还 有 一 本 完全 介绍 该 问题 的 定理 和 算法 的 书 (O’Rourke，1987)。 

在 文献 (Cook 1971) 中 发 现 3 可 满足 性 问题 是 NP 完 全 的 。 色 数 问题 的 NP 完 全 性 是 由 文 
献 Karp(1972) 所 建立 。 对 于 子 集 和 、 分 割 和 装 箱 问 题 的 NP 完 全 性 可 参阅 Horowitz and Sahni 
(1978)。VLSI 离 散布 局 问题 由 Lapaugh(1980) 证 明 是 NP 完 全 的 。 

2 可 满足 性 问题 由 Cook(1971) 和 Even，Itai and Shamir(1976) 证 明 是 多 项 式 时 间 的 问题 ， 该 
问题 在 Papadimitriou(1994) 中 也 有 讨论 。 

还 有 几 个 有 名 的 问题 疑 为 NP 完 全 的 ，Garey and Johnson(1978) 给 出 了 一 个 列表 。 其 中 之 一 
即 线性 规划 问题 ， 后 来 由 Khachian(1979) 证 明 是 多 项 式 算法 ， 可 参阅 文献 Papadimitriou and 
Steiglitz(1982)。 

最 后 ， 还 有 另 一 个 概念 称 为 平均 完全 的 (average complete), 。 如 果 一 个 问题 是 平均 完全 的 ， 
那么 它 恰好 在 平均 情况 下 是 困难 的 。 瓷 砖 问题 (tiling problem) (Berger, 1966) 由 文献 Levin 
(1986) 证 明 是 平均 完全 的 。Levin(1986) 可 能 是 已 出 版 的 最 短 的 论文 ， 仅 有 一 页 半 长 ， 但 却 是 最 
难 领会 的 论文 。 如 果 你 不 能 理解 它 ， 不 要 恼火 ， 很 多 的 计算 机 科学 家 都 不 理解 这 篇 论文 。 


8.10 进一步 的 阅读 资料 


NP 完 全 性 是 最 兴奋 的 研究 主题 之 一 ， 许 多 看 似 容易 的 问题 被 发 现 是 NP 完 全 的 。 我 们 鼓励 
读者 阅读 Johnson 在 Journal of Algorithm 撰 写 的 关于 该 领域 进展 的 文章 。 我 们 推荐 下 面 的 论文 ， 
许多 是 最 近 出 版 的 ， 而 在 任何 教科 书 都 找 不 到 ;Ahuja (1988), Bodlaender (1988); Boppana, 
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Hastad and Zachos (1987); Cai and Meyer (1987); Chang and Du (1988); Chin and Ntafos 
(1988); Chung and Krishnamoorthy (1994); Colbourn, Kocay and Stinson (1986), Du and Book 
(1989); Du and Leung (1988); Fellows and Langston (1988); Flajolet and Prodiuger (1986); 
Friesen and Langston (1986); Homer (1986); Homer and Long (1987); Huynh (1986); Johnson, 
Yanakakis and Papadimitriou (1988); Kirousis and Papadimitriou (1988); Krivanek and Moravek 
(1986); Levin (1986); Megido and Supowit (1984), Monien and Sudborough (1988); Murgolo 
(1987), Papadimitriou (1981); Ramanan, Deogun and Lin (1984); Wu and Sahni (1988); 
Sarrafzadeh (1987), Tang, Buehrer and Lee (1985); Valiant and Vazirani (1986); Wang and Kuo 
(1988) and Yannakakis (1989), 

对 于 更 新 的 成 果 ， 可 参阅 Agrawal，Kayal and Saxena (2004); Berger and Leighton 
(1998), Bodlaender, Fellows and Hallet (1994), Boros, Crama, Hammer and Saks (1994), 
Caprara (1997a),; Caprara (1997b), Caprara (1999), Feder and Motwani (2002); Ferreira, de 
Souza and Wakabayashi (2002); Foulds and Graham (1982), Galil, Haber and Yung (1989), 
Goldberg, Goldberg and Paterson (2001); Goldstein and Waterman (1987); Grove (1995), 
Hochbaum (1997), Holyer (1981); Kannan and Warnow (1994); Kearney, Hayward and Meijer 
(1997), Lathrop (1994), Lent and Mahmoud (1996); Lipton (1995); Lyngso and Pedersen 
(2000); Ma, Li and Zhang(2000); Maier and Storer(1977); Pe’er and Shamir(1998); Pierce and 
Winfree(2002); Storer(1977); Thomassen(1997), Unger and Moult(1993) and Wareham (1995), 


习题 


8.1 确定 下 面 的 陈述 正确 与 否 。 
(1) 如 果 一 个 问题 是 NP 完全 的 ， 那 么 在 最 坏 情 况 下 ， 它 不 能 被 任何 多 项 式 算法 解决 。 
(2) 如 果 一 个 问题 是 NP 完全 的 ， 那 么 在 最 坏 情 况 下 ， 找 不 出 解决 它 的 任何 多 项 式 算 法 。 
(3) 如 果 一 个 问题 是 NP 完全 的 ， 那 么 在 最 坏 情 况 下 ， 将 来 也 是 不 可 能 找到 解决 它 的 任何 多 项 式 
算法 。 
(4) 如 果 一 个 问题 是 NP 完全 的 ， 那 么 在 平均 情况 下 ， 不 可 能 找到 解决 它 的 多 项 式 算法 。 
(5) 如 果 能 证 明 一 个 NP 完全 问题 的 下 界 是 指数 的 ， 那 么 就 可 以 证 明 NP 冯 P。 
8.2 确定 下 面 每 个 子 句 集 的 可 满足 性 。 


d) -X V =X; v X, 
X, 
X, v X, 
—X, 

(2) X V X, v x, 
-X, v X, V x, 
X, VX V X \ 
X, v X, V =X, 
-X, V =X, V X, 
X, V -X V =X; 
-X, V X, V -X 
-x, V =X, V Xx, 

(3) x, V X V X; 
X, V X, 
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8.3 
8.4 
8.5 
8.6 


8.7 


8.8 


8.9 


8.10 


8.11 


8.14 








(4) X Vo x Vv x 


=X, 
我 们 都 知道 如 何 证 明 一 个 问题 是 NP 完 全 的 ， 但 如 何 证 明 一 个 问题 不 是 NP 完 全 的 呢 ? 


完成 在 本 章 描述 过 的 严格 覆盖 问题 的 NP 完 全 性 证 明 。 
完成 在 本 章 描述 过 的 子 集 和 问题 的 NP 完全 性 证 明 。 


考虑 下 面 的 问题 ， 已 知 两 个 输入 变量 a 和 b，、 如 果 a>b， 那 么 返回 “YES”， 否 则 返回 “NO”。 
设计 解决 该 问题 的 非 确定 型 多 项 式 算法 。 并 将 该 问题 转换 为 一 个 布尔 公式 ， 使 得 当 且 仅 当 转换 
来 的 布尔 公式 可 满足 ， 那 么 该 算法 返回 “YES”。 
最 大 团 判 定 问 题 (maximal clique decision problem); 最 大 团 是 一 个 图 的 最 大 完全 子 图 。 最 大 团 
的 规模 是 在 其 中 的 顶点 数 。 团 判定 问题 是 对 于 某 个 上 E， 确 定 是 否 存在 最 小 规模 为 K 的 最 大 团 。 通 
过 将 可 满足 性 问题 归 约 到 它 ， 证 明 最 大 团 判 定 问题 是 NP 完全 的 。 
顶点 覆盖 判定 问题 (vertex cover decision problem); 一 个 图 的 顶点 集 3 是 该 图 的 顶点 履 盖 ， 当 
且 仅 当 该 图 所 有 的 边 至 少 邻 接 $ 中 的 一 个 顶点 。 顶 点 覆盖 判定 问题 是 确定 一 个 图 是 否 有 最 坏 的 
个 顶点 的 顶点 和 覆盖。 证明 顶 点 覆盖 判定 问题 是 NP 完全 的 。 
旅行 商 判 定 问题 (traveling salesman decision problem); 通过 证 明 哈 密 顿 回路 问题 可 多 项 式 归 
约 到 旅行 商 判定 问题 ， 证 明 该 问题 是 NP 完 全 的 。 哈 密 顿 回路 判定 问题 的 定义 可 在 关于 算法 的 
任何 教科 书 中 找到 。 
独立 集 判 定 问题 (independent set decision problem): 已 知 图 G 和 整数 :， 独 立 集 判定 问题 是 确 
定 是 否 存在 k 个 顶点 的 集合 $， 使 得 S$ 中 没有 两 个 顶点 是 通过 一 条 边 连通 的 。 证 明 独 立 集 判 定 问 
题 是 NP 完全 的 。 | 
瓶颈 旅行 商 判 定 问题 (bottleneck traveling salesman decision problem): 已 知 一 个 图 及 一 个 数 
M， 撼 颈 旅 行商 判定 问题 是 确定 在 该 图 中 是 否 存在 一 个 哈密 顿 回 路 ， 使 得 该 回路 的 最 长 边 小 
于 M。 证 明 瓶 颈 旅行 商 判定 问题 是 NP 完全 的 。 
证 明 8 可 着 色 < 4 可 着 色 < 上 可 着 色 。 
单调 子 句 可 满足 性 问题 (clause-monotone satisfiability problem): 如 果 一 个 公式 的 每 个 子 只 
含 正 变量 或 者 负 变 量 ， 那 么 这 个 公式 是 单调 的 。 例 如 ， 

F =(X,VX,) & (-X;) & (X; V —X;) 
是 一 个 单调 公式 。 证 明 判 定 一 个 单调 公式 是 否 可 满足 的 问题 是 NP 完全 的 。 
对 于 8 维 匹 配 问题 (8-dimensional matching problem) 的 NP 完 全 性 ， 阅 读 文献 Papadimitriou 
and Steiglitz (1982) 中 的 定理 15.7。 





第 9 章 近似 算法 


在 前 面 各 章 所 介绍 的 每 个 算法 都 给 出 最 优 解 。 显 然 我 们 要 为 此 付出 代价 : 产生 这 些 最 优 
解 消耗 的 时 间 可 能 会 非 党 长。 如果 问题 是 NP 完全 问题 ， 那 么 产生 最 优 解 的 算法 过 程 将 会 有 一 
个 不 现实 的 时 间 消 耗 。 

一 种 折 吉 方法 是 使 用 启发 式 的 解 。 词 语 “ 启 发 式 ” 可 以 解释 为 “有 根据 的 推测 "。 因 此 ， 
启发 式 算 靶 将 会 是 一 种 基于 有 根据 的 推测 的 算法 。 肉 为 是 启发 式 推测 算法 ， 所 以 不 能 保证 它 
会 产生 最 优 解 。 事 实 上 ， 通 常 也 不 会 产生 最 优 解 。 

本 章 将 介绍 几 个 启发 式 算法 。 当 然 这 些 启发 式 算法 不 能 保证 产生 最 优 解 ， 只 能 保证 由 非 
最 优 解 产 生 的 误差 可 以 预先 估计 。 所 有 这 样 的 算法 称 为 近似 算法 (approximation algorithms)。 


91 顶点 覆盖 问题 的 近似 算法 


已 知 图 G = (V, E)， 如 果 图 中 每 条 边 与 Y 中 一 个 
顶点 集 5 的 某 个 顶点 邻接 ， 那 么 称 5 为 G 的 一 个 顶点 
覆盖 (node cover), -个 顶点 覆盖 3$ 的 规模 是 $ 中 
顶点 的 数目 。 顶 点 覆盖 问题 (node cover problem) 
是 找 出 G = (V, EE) 的 最 小 顶点 有 覆盖。 例如，{v), v，, 
v} 是 如 图 9-1 所 示 的 顶点 覆盖 ，{v， v;} 是 最 小 规模 
的 顶点 覆盖 。 

质点 覆盖 问题 已 被 证 明 是 NP 难 的 。 对 该 问题 图 9-1 “个 例 图 
介绍 一 个 近似 算法 ， 即 算法 9-1。 


算法 9-1 顶点 覆盖 问题 的 近似 算法 








MA: BIG =(V. E), 
输出 : GH SURES. 
HR. 今 S= 由 及 E = EE。 
步骤 2. while E'% @ 
从 E' 中 任意 选取 一 条 边 (a. b), 
AS = SUla. b}, EE tah BRA RG. IESE = EE", 
end while 


步骤 3. 输出 5。 


现在 考虑 如 图 9-1 所 示 的 图 G。 算 法 9-1 中 的 步骤 18 =o, E = { v) (Vis Vs), (V2 V3), (v2 
va), (Va Vs) (Va vs)}。 由 于 E' 产 9， 执行 步骤 2 中 的 循环 。 假如 此 次 从 E' 中 挑选 边 (v,, v;)， 那 么 在 
循环 结束 时 ， 有 3 = {vv}, E' = {0 vs)，(v4 v5)}。 接 下 来 ， 由 于 E' 取 $9， 执行 步 又 2 中 的 第 二 
次 循环 。 假 如 此 次 从 E' 中 挑选 出 边 (v,, vs )， 那 么 在 第 二 次 循环 结束 时 ， 有 S = {vo Vo Var Ys), 
E'=@, RA, ， 输 出 G 的 顶点 覆盖 为 {w Vo vy Vs}. 

上 述 算法 的 时 间 复 杂 度 是 O(EI)。 将 会 看 到 算法 9-1 找 出 G 的 顶点 覆盖 的 规模 至 多 是 G 的 最 
小 顶点 覆盖 规模 的 两 倍 。 令 Mx 表示 G 的 最 小 规模 的 顶点 覆盖 ，M 表 示 由 算法 9-1 找 出 的 G 的 顶 
点 绪 盖 的 规模 ，L 表 示 由 算法 选 出 的 边 总 数 。 由 于 在 步骤 2 的 每 -- 次 循环 中 挑 出 一 条 边 ， 且 每 
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条 迪 都 关联 两 个 顶点 ， 所 以 有 AM = 2L。 由 于 在 步骤 2 中 不 可 能 选 出 两 条 边 共享 任何 一 个 端 顶点 ， 
所 以 至 少 需 要 LL 个 顶点 覆盖 这 LL 条 边 ， 那 么 有 L<M*。 最 终 ，M = 2L<2M*。 


9.2 欧 几 里 得 旅行 商 问题 的 近似 算法 


欧 几 里 得 旅行 商 问题 (ETSP) 是 找 出 通过 平面 上 n 点 集合 5 的 最 短 闭 回 路 ， 这 个 问题 已 被 
证 明 是 NP 难 的 。 因 此 ， 不 太 可 能 存在 有 效 的 最 坏 情 况 下 欧 几 里 得 旅行 商 问 题 的 算法 。 

在 本 节 将 描述 欧 几 里 得 旅行 商 问题 的 近似 算法 ， 找 出 一 条 是 最 优 解 3/2 倍 范围 内 的 回路 。 
就 是 说 ， 如 果 最 优 回路 长 度 为 L， 那 么 该 近似 回路 的 长 度 不 会 超过 (3/2)L。 

近似 方案 的 基本 思想 是 构造 一 个 顶点 集 的 欧 拉 回路 ， 然 后 用 它 来 寻找 近似 回路 。 一 个 图 
的 欧 拉 回路 是 图 的 一 个 回路 ， 在 该 回路 中 对 图 的 每 个 顶点 的 访问 不 必 是 一 次 ,而 对 图 的 每 条 
边 的 访问 只 能 是 一 次 。 当 图 包含 一 条 欧 拉 回路 时 ， 称 该 图 为 欧 拉 图 。 欧 拉 证 明了 图 G 是 欧 拉 图 ， 
当 且 仅 当 G 是 连通 的 ， 并 且 G 中 所 有 顶点 的 度数 均 为 偶数 。 考 虑 下 面 的 图 9-2， 显 然 图 9-2a 所 示 
的 图 是 一 个 欧 拉 图 ， 而 图 9-2b 不 是 。 稍 后 将 会 看 到 找到 欧 拉 回路 之 后 ， 只 需 通过 简单 地 志 历 
欧 拉 图 ， 并 且 绕 过 之 前 访问 过 的 顶点 ， 就 可 以 找到 一 条 哈密 顿 回 路 。 

因此 ， 构 造 一 个 点 集 $ 的 连通 图 G (也 就 是 ， 使 用 8 中 的 点 作为 G 中 的 顶点 ) ， 使 得 G 中 每 个 
顶点 的 度 都 是 偶数 ， 就 可 以 构造 一 条 欧 拉 回 路 ， 然 后 找到 一 条 哈密 顿 回路 来 近似 最 优 旅行 商 
同 路 。 

近似 方案 由 以 下 三 步 组 成 : 首先 ， 构 造 $ 的 一 棵 最 小 生成 树 。 例 如 ， 考 虑 图 9-3。 对 于 有 8 
个 点 的 点 集 $， = {P,, Pa ++, Py}, S| 的 一 棵 最 小 生成 树 如 图 9-3 所 示 。 


ee 


a) b) P, 


P, Pe 





P; 


图 9-2 有 欧 拉 回路 与 没有 欧 拉 回路 的 图 图 9-3 8 个 点 的 最 小 生成 树 


尽管 最 小 生成 树 是 连通 的 ， 但 它 可 能 包含 奇数 度 的 顶点 。 事 实 上 ， 可 以 证 明 在 任何 树 中 ， 
总 有 偶数 个 这 样 的 顶点 。 例 如 ， 在 图 9-3 中 的 {P,，P,, Ps, Pa Po Ps} 点 集中 的 每 一 个 顶点 的 度 都 
是 奇数 。 第 二 步 是 构造 一 个 欧 拉 图 ， 也 就 是 必须 加 入 更 多 的 边 使 得 所 有 的 顶点 都 是 偶数 度 。 
这 个 问题 变 成 了 如 何 找到 这 样 的 边 集 ?” 在 该 算法 中 ， 对 奇数 度 的 点 集 使 用 最 小 欧 几 里 得 加 权 
匹配 。 已 知 平面 中 的 一 个 点 集 ， 最 小 欧 几 里 得 加 权 匹 配 问 题 (minimum weighted matching 
problem) 通过 线段 成 对 地 添加 点 ， 使 得 总 长 度 最 小 。 如 果 可 以 找到 奇数 度 顶点 的 最 小 欧 几 里 
得 加 权 匹 配 ， 扩 充 匹 配 的 边 集 到 最 小 生成 树 的 边 集中 ， 那 么 产生 的 图 是 一 个 欧 拉 图 。 例 如 ， 
THARP), Ps, Py, Ps P, 和 Ps 的 最 小 欧 几 里 得 加 权 匹配 如 图 9-4 所 示 。 
在 把 图 9-4 中 的 边 加 入 图 9-3 中 的 最 小 生成 p oP 

树 之 后 ， 所 有 顶点 的 度数 都 是 偶数 的 。 算 法 的 `’, 
第 三 步 在 结果 图 外 构造 一 条 欧 拉 回 路 ， 然 后 由 一 

欧 拉 回路 得 到 哈密 顿 加 路。 上 述 8 个 顶点 集 的 | Ps P 
欧 拉 回 路 是 已 ,一 P， P, P,—P; P-—P; PP 一 已 一 
P,-P，( 注 意 P, 和 已 遍历 了 两 次 )， 如 图 9-5a 所 

示 。 绕 过 P AP), HRP. GP ME, BHI 图 9-4 6 个 顶点 的 最 小 欧 几 里 得 加 权 匹配 
条 哈密 顿 上 回路。 因此， 得 到 的 近似 回路 是 PP;-P;-Ps-P;-P,~Ps-Ps-Pl， 如 图 9-5b 所 示 。 
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a) b) 
图 9-5 一个 欧 拉 回路 以 及 结果 近似 回路 











算法 9-2 ETSP 的 近似 算法 
HA. FR ba RAS, 
输出 : 5 的 一 个 近似 旅行 商 问 路 。 
步骤 1. 找 出 $ 的 最 小 生成 树 7。 
步骤 2. 在 7 中 的 奇数 度 硕 点 集 上 找到 最 小 欧 玉 里 得 加 权 抱 配 41， 邻 G = MUT, 
BMS. 找到 G 的 欧 拉 加 路， 然后 通过 绕 过 所 有 已 经 过 万 过 的 据点， 通过 过 万 该 欧 拉 问 路 找到 哈密 顿 四 路 作为 
ETSP 的 近似 路 从 。 


对 该 算法 的 时 间 复 杂 度 分 析 是 容易 的 。 步 又 1 可 以 在 O(n log 刀 时 间 内 执行 完 ， 而 在 O(e ) 
时 间 内 可 以 找到 最 小 欧 拉 加 权 匹 配 ， 欧 拉 回 路 可 以 在 线性 时 间 内 构造 ， 由 该 欧 拉 回路 得 到 哈 
密 顿 回路 也 可 以 在 随后 的 线性 时 间 内 得 到 。 因 此 ， 上 述 算 法 的 时 间 复 杂 度 是 O(n”)。 因 为 在 此 
讨论 的 主要 目标 是 说 明 近 似 算法 ， 所 以 不 给 出 寻找 最 小 匹配 和 欧 拉 回路 算法 的 具体 细节 。 

令 [ 为 5 的 最 优 旅 行商 回路 。 如 果 从 L 中 移 走 -- 条 思 ， 得 到 路 径 L, ， 它 同样 是 5 的 一 棵 生成 
树 。 令 T 表 示 5 的 一 棵 最 小 生成 树 ， 由 于 7 是 5 的 最 小 生成 树 ， 那 么 有 Iiength(7) <length(L, )< 
length(L), Ç {i in …, bb} 为 了 中 奇数 度 的 顶点 下 标的 集合 ， 它 们 在 集合 中 安排 成 与 在 最 优 旅 
行商 回路 L 中 的 次 序 -…- 样 。 考虑 奇数 度 顶 点 的 两 个 匹配 MM = {Li, iJ, [is tals. Dizm -i izn DAH 
M, = {lis i], [is ish v, lin ADe PSD SXK, BRA length) > length M,) + 
length(M,), MALI, izn ,PPv} 的 最 优 欧 几 里 得 加 权 匹 配 。 因 此 ， 两 个 匹配 长 度 较 短 的 比 
length(M) 的 长 度 长 ， 所 以 有 Ilength(M)<length(L)/2。 由 于 G = TUM， 那 么 length(G) = 
length(7) + length(M) <length(L) + length(L)/2 <3/2length(L), 

由 于 上 面 的 解 是 哈密 顿 回路 ， 比 G 的 长 度 短 ， 因 此 ， 有 一 个 欧 拉 旅行 商 问题 的 近似 算法 ， 
产生 -一 个 近似 的 回路 ， 在 时 间 O(z) 内 最 优 解 的 3/2 倍 范围 之 内 。 


9.3 特殊 瓶颈 旅行 商 问题 的 近似 算法 


旅行 商 问 题 也 可 以 定义 在 图 上 : 已 知 一 个 图 ， 要 求 从 某 个 顶点 开始 ， 遍 历 图 中 所 有 的 顶 
点 并 回 到 开始 顶点 ， 找 出 这 样 的 最 短 闭 合 回路 。 该 问题 已 被 证 明 是 NP 难 的 。 

在 本 节 将 考虑 另 一 种 类 型 的 旅行 商 问 题 。 仍 然 关 心 闭合 回路 。 然 而 ， 不 要 求 整 个 回路 的 
长 度 最 短 ， 而 是 要 求 整 个 回路 的 最 长 边 最 短 。 也 就 是 说 ， 要 找 出 一 条 最 长 边 为 最 短 的 回路 。 
因此 这 是 一 个 最 小 最 大 问题 (mini-max problem) ， 称 这 种 类 型 的 旅行 商 问题 为 瓶颈 旅行 商 问 
i (bottleneck salesperson problem)， 因 为 它 通常 属于 与 运输 学 问题 相关 的 一 类 疹 颈 问题 。 事 
实 上 ， 可 以 看 到 ， 之 前 讨论 的 许多 问题 可 以 修改 成 为 瓶颈 问题 。 例 如 ， 最 小 生成 树 问题 有 一 
个 瓶颈 问题 的 变形 。 在 这 个 变形 中 ， 将 找到 其 最 长 边 为 最 短 的 生成 树 。 

再 次 如 同 前 两 节 一 样 ， 这 里 将 给 出 一 个 近似 算 靶 。 在 介绍 该 算 共 之前， 声明 以 下 的 假设 ; 

(1) 研究 的 图 是 一 个 完全 图 (complete graph) 。 也 就 是 ， 每 一 对 顶点 之 间 都 有 一 条 边 。 

(2) 所 有 的 边 都 遵守 三 角 不 等 式 规则 。 因 此 ， 钴 颈 旅行 商 问 题 是 一 种 特例 ， 可 以 证 明 这 种 
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在 介绍 近似 算法 之 前 ,提出 一 个 不 是 多 项 式 级 的 算法 。 该 算法 将 产生 瓶颈 旅行 商 问 题 的 
最 优 解 。 然 后 ， 将 该 算法 修改 为 近似 算法 。 

首先 把 图 G = (V, E) 中 的 边 排 序 成 非 递 碱 序列 lell<lesl<… <le,1。 令 Gle;) 表示 从 G = (V, 
已 中 删除 所 有 比 e; 长 的 边 而 得 到 的 图 。 考 虑 G(e, )， 如 果 G(e) 包 含 一 条 哈密 尔 顿 回路 ， 那 么 该 
哈密 顿 回路 就 是 所 要 找 的 最 优 解 ， 否 则 ， 考 虑 G(e,)。 重 复 此 过 程 直 到 某 个 Gle;) 包 含 了 一 条 哈 
密 顿 回路 ， 然 后 返回 该 哈密 顿 回路 作为 特殊 瓶颈 旅行 商 问题 的 最 优 解 。 

用 一个 例子 解释 上 面 的 思想 。 参 见 图 9-6 所 示 。 为 了 找到 一 条 有 最 长 边 为 最 短 的 哈密 顿 回 
路 ， 可 以 尝试 从 G(4C) 开 始 ，4C 的 长 度 是 12。 因 此 ， 如 图 9-7 所 示 ，G(4O) 仅 包含 那些 长 度 小 
于 或 等 于 12 的 边 。 在 G(4C) 中 没有 哈密 顿 回路 。 尝 试 6(8D)， 因 为 BD 是 下 一 条 最 长 边 。G(BD) 
如 图 9-8 所 示 ， 在 G(8D) 中 有 一 条 哈密 顿 回路 ， 也 就 是 4-8-D-C-E-F-G-A4。 可 以 推断 找 出 了 最 
优 解 ， 以 及 最 优 解 的 值 是 13。 








图 9-6 一 个 完全 图 图 9-7 图 ?96 的 C(4C) 


由 于 寻找 哈密 尔 顿 回路 是 一 个 NP 难 的 问题 ， 所 以 该 算法 不 是 多 项 式 级 的 。 下 面 将 介绍 一 
个 近似 算法 该 近似 算法 仍 具 有 上 述 算法 的 思想 。 在 介绍 这 个 近似 算法 之 前 ， 首 先 介绍 双 连 通 
(biconnectedness) 的 概念 。 图 4 是 双 连 通 的 ， 当 且 仅 当 其 每 一 对 顶点 至 少 属于 一 个 公共 的 简 
单 回路 。 

例如 ， 在 图 9-9 中 ，G; BREN, MG, 不 是 。 因 为 顶点 4 和 顶点 C 不 在 任何 简单 回路 中 。 
另 一 方面 ， 在 G, 中 ， 每 一 对 顶点 都 属于 至 少 一 个 公共 简单 回路 中 。 接 下 来 定义 图 的 害 (power 
of a graph) HEAL. de RG = (V, 再 是 一 个 任意 图 ，! 是 一 个 正 整 数 ， 令 图 G 的 ! 次 寨 表示 为 G = 
(V, E' )， 其 中 在 G' 中 有 一 条 边 (u,v)， 无 论 何 时 在 图 G 中 都 有 一 条 从 Wu 到 Vv 至 多 1 条 边 的 路 径 。 





图 9-8 图 9-6 的 G(8D) 图 9-9 双 连 通 的 例子 
双 连 通 图 有 一 个 非常 重要 的 性 质 ， 如 果 图 G 是 双 连 通 的 ， 那 么 G? 必 有 一 条 哈密 顿 回路 。 
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显然 ， 在 图 9-10 是 双 连 通 的 。 例 如 ， 顶 点 D 和 F 在 同一 个 简单 回路 D-C-F-E-D 中 。 现 在 考虑 图 
9- 自 所 示 的 GY。 在 图 9- 二 的 图 中 有 -条 哈密 顿 回路 ， 即 4-8-C-D-F-E-G-A4。 











A 
B eo on C 
E 
C 一 
-一 
D = E 
图 9-10 “个 双 连 通 图 图 9-11 图 9-10 所 示 图 的 OG 


基于 此 性 质 ， 每 个 双 连 通 图 G，G’ 都 有 … 条 哈密 顿 回 路 ， 可 以 用 下 面 的 方法 给 出 瓶颈 旅 
行商 问题 的 近似 解 。 如 前 述 ， 将 G 的 边 排序 为 非 递减 序列 : lell<lesl<… le,1。 令 G(e;) 只 包 
含 长 度 小 于 或 等 于 边 e; 长 度 的 边 。 从 G(e) 开 始 考虑 、 如 果 G(eij) 是 双 连 通 的 ， 那 么 构造 G(ei); 
否则 ， 考 虑 G(e,)。 重 复 此 过 程 直到 找到 第 一 个 使 Gle, ) 是 双 连 通 的 i。 然 后 构造 G(e;)*。 该 图 必 
定 包含 一 条 哈密 顿 回路 ， 可 将 此 哈密 顿 回 路 作为 近似 解 。 

近似 算法 正式 描述 如 下 : 


算法 9-3 ”特殊 瓶颈 旅行 商 问题 的 近似 算法 
MA. 完全 图 G = (VE). JC A a EK, 
输出 ;，G 中 的 一 条 四 路， 其 最 长 的 条 边 不 大 于 G 的 特殊 翔 颈 旅行 商 问题 最 优 解 值 的 由 倍 。 
WR. 将 边 排序 为 leis le, < e slelo 
步骤 2. i=l, 
步骤 3. 如 朵 G(e,) 是 双 连 通 的 ， 那 么 构造 Gle, 这， 并且 尘 找 Gtei 广 中 的 一 条 哈密 顿 加 路， 将 其 作为 输出 返回 ， 奉 
则 ， 转 向 步骤 4。 
PRA isil, fiu p, 


现在 通过 一 个 例子 来 说 明 该 算法 。 参 见 图 9-12 所 示 ， 它 表明 了 G(FE)(IFEl = 8)， 图 G 如 图 
9-6 所 示 。CG(FE) 不 是 双 连 通 的 。 因 为 IFGI = 9， 所 以 考虑 G(FC)。 如 图 9-13 所 示 G(FG) 是 双 连 
通 的 ,然后 构造 G(FG)， 如 图 9-14 所 示 。 在 这 个 图 中 有 一 条 哈密 顿 回 路 ， 即 4-G-E-F-D-C-B-4。 
在 这 条 回路 中 ， 最 长 边 的 长 度 是 16。 必 须 注意 到 这 并 不 是 最 优 解 ， 由 于 在 图 9-6 中 的 瓶颈 旅行 
商 问 题 的 最 优 值 是 13， 它 比 16 小 。 

A = 
G, 


\ 


图 9-12 图 9-6 的 G(FE) 图 9-13 图 9-6 的 G(FG) 
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下 面 讨论 与 近似 算法 相关 的 三 个 问题 : 

(1) 近似 算法 的 时 间 复 杂 度 是 多 少 ? 

(2) 近似 解 的 界 是 什么 ? 

(3) 在 特定 意义 下 ， 该 界 是 最 优 的 吗 ? 

首先 回答 第 一 个 问题 。 双 连通 性 的 判定 可 以 通 
过 多 项 式 算法 求解 。 进 而 ， 如 果 G 是 双 连 通 的 ， 那 
么 存在 一 个 解决 G 的 哈密 顿 问题 的 多 项 式 算法 。 因 
此 ， 该 近似 算法 是 多 项 式 级 的 。 

现在 回答 第 二 个 问题 : 近似 解 的 界 是 什么 ? 考 
虑 下 面 的 问题 ，G = (V, E) 的 边 子 图 是 G 的 具有 顶点 
集 V 的 子 图 。 在 6G 的 所 有 边 子 图 中 ， 找 出 一 个 双 连 
通 的 最 长 边 为 最 短 的 边 子 图 。 显 然 ， 用 上 面 的 近似 
算法 找到 的 第 一 个 Gle; ) 是 双 连 通 的 ， 它 必定 是 该 问题 的 一 个 解 。 令 ew 为 特殊 瓶颈 旅行 商 问题 
最 优 解 的 最 长 边 。 显 然 ， 由 于 任意 旅行 商 问 题 的 解 都 是 双 连 通 的 ， 故 有 le;1<le。,1。 在 找到 G(e;) 
之 后 ， 构 造 G(e,。 由 于 所 有 的 边 都 服从 三 角 不 等 式 ， 所 以 Gle; ) 中 最 长 边 的 长 度 不 大 于 2le;1。 
因而 由 近似 算法 产生 的 最 优 解 的 值 不 大 于 le;1<2le,,1。 也 就 是 ， 虽 然 近 似 算法 并 没有 产生 最 优 
解 ， 但 是 其 解 的 值 仍然 限定 在 最 优 解 的 两 倍 范围 之 内 。 

下 面 通 过 所 给 的 例子 来 检验 上 述 的 结论 。 在 上 面 的 例子 中 ，lew1= 13。 由 近似 算法 产生 的 
解 是 16。 由 于 16< 2 . 13 = 26， 所 以 在 这 种 情况 下 ， 结 论 是 正确 的 。 

最 后 ， 回 答 第 三 个 问题 : 该 近似 解 的 界 是 最 优 的 吗 ? 即 ， 是 否 有 另 一 个 多 项 式 近 似 算法 
产生 的 解 的 界 小 于 2 倍 ? 例如 ， 对 于 所 有 的 问题 实例 ，-- 个 多 项 式 近 似 算法 产生 最 长 边 小 于 或 
等 于 1.5 倍 最 优 解 的 近似 解 ， 这 可 能 吗 ? 

现在 将 说 明 这 很 可 能 是 不 可 能 的 。 如 果 有 这 样 的 近似 算法 ， 并 且 是 多 项 式 级 的 ， 那么 可 
以 用 这 个 算法 解决 NP 完全 问题 。 就 是 说 ， 如 果 有 一 个 产生 的 界 小 于 两 们 最 优 解 的 多 项 式 近 似 
算法 ， 那 么 有 NP = P。 我 们 使 用 的 特殊 NP 完全 问题 是 哈密 顿 回 路 决策 问题 (Hamiltonian 
cycle decision problem ) 。 

假设 对 于 特殊 瓶颈 旅行 商 问 题 存 在 多 项 式 算 法 4， 使 得 4 确保 对 于 每 条 边 满足 三 角 不 等 式 
的 完全 图 G, 产生 值 小 于 2v* 的 解 ， 其 中 v* 是 Ge 的 特殊 瓶颈 旅行 商 问题 最 优 解 的 值 。 对 于 任意 
RIG = (Y, E)， 可 以 将 G 变 换 为 一 个 完全 图 G, ， 并 且 定 义 Gc 的 边 值 为 


f1 WRG, J EE 
i |) 否则 
显然 ， 上 面 c; 的 定义 满足 三 角 不 等 式 。 现 在 来 解决 G。 的 瓶颈 旅行 商 问题 。 显 然 
。_ [1 如 果 G 是 哈密 顿 图 
1) 否则 

等 价 地 ，v* = 1 当 且 仅 当 G 是 哈密 顿 图 。 

也 就 是 说 ， 如 果 能 够 解决 G,. 的 瓶颈 旅行 商 问 题 ， 那 么 可 以 解决 G 的 哈密 顿 回路 决策 问题 。 
简单 地 检测 yx 的 值 ，G 是 哈密 顿 图 当 且 仅 当 v# = 1。 下 面 将 说 明 虽 然 事 实 上 算法 4 仅 是 瓶颈 旅 
行商 问题 的 近似 算法 ， 但 可 以 使 用 4 来 解决 哈密 顿 回路 问题 。 

根据 假设 ， 算 法 4 可 以 产生 一 个 值 小 于 2v# 的 近似 解 。 考 虑 G 是 哈密 顿 图 的 情况 ， 那 么 近 














图 9-14 GUFGY 
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似 算法 4 将 产生 一 个 值 V 小 于 2v* = 2 的 近似 解 。 

也 就 是 ， 如 果 G 是 哈密 顿 图 ， 由 于 边 的 权 值 只 有 1 和 2， 那 么 VW, = 1。 因 此 ， 认 为 可 以 使 用 
算法 A 解决 G 的 哈密 顿 回路 决策 问题 。 如 果 A 是 多 项 式 级 的 ， 因 为 哈密 顿 回路 决策 问题 是 NP 完 
全 问题 ,那么 有 NP = 了。 

上 面 的 讨论 说 明 存 在 这 样 的 算法 是 不 大 可 能 的 。 


9.4 特殊 瓶颈 加 权 k 供 应 商 问题 的 近似 算法 


特殊 瓶颈 加 权 k 供 应 商 问 题 (special bottleneck weighted k-supplier problem) 是 近似 算法 
的 另 一 个 例子 。 在 该 问题 中 ， 已 知 一 个 所 有 边 均 满 足 三 角 不 等 式 的 完全 图 ， 边 的 权 值 可 看 作 
是 距离 ， 所 有 顶点 分 在 两 个 集合 中 ， 供 应 商 集 合 V 以 及 消费 者 集合 Vv 。 此 外 ， 每 个 供应 商 
顶点 i 有 一 个 权 值 w; ， 表 示 在 这 个 顶点 建立 供应 GD 
中 心 的 代价 。 选 择 一 个 总 权 值 最 多 为 上 的 供应 商 
集合 ， 使 得 供应 商 与 消费 者 之 间 的 最 长 距离 为 
最 短 。 

考虑 图 9-15， 有 9 个 顶点 ， 即 YY = {A, B, 








C, =, I}, Vup = {As B, C, DY RV ius, = {E, F, G, H, 

I). BERRA, B, C 和 DP 的 代价 分 别 是 1, 2, 3 和 4。 

注意 在 图 9-15 中 显示 一 个 完全 图 ， 在 图 9-15 中 所 [N € 

有 消失 的 边 的 代价 比 图 9-15 中 的 最 大 代价 还 大 mesi ONO 
但 是 所 有 边 的 代价 值 仍 满足 三 角 不 等 式 。 图 9-15 一 个 加 权 /的 供应 商 问题 实例 


假设 t = 5。 图 9-16 显 示 了 几 个 可 行 解 ， 最 优 解 如 图 9-16d 所 示 ， 其 解 的 值 为 20。 





E F G H I E F G H I 
@ e @ e 
A B C D A B C D 
WA=1 WB) = 2 WiC) = 3 WD)=4 WA)=1 W(B) = 2 wc) =3 W(D)=4 
a) Maximum = 23 b) Maximum = 22 
F G H I 
16 t4 2\ 16/ a ia Ny 
e e 
A B C D 
WA) = 1 WB) =2 WiC) =3 WD) =4 WA) = W(B) = 2 mo- 3 WD) = 4 
c) Maximum = 21 d) Maximum = 20 


图 9-16 图 9-15 问 题 实例 的 几 个 可 行 解决 方案 
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将 要 介绍 的 近似 算法 与 9.3 节 用 来 解决 特殊 瓶颈 旅行 商 问 题 的 近似 算法 是 相似 的 。 为 求解 
该 特殊 瘾 颈 加 权 K 供 应 商 问题 ， 将 边 排 序 为 非 递 减 序列 : le b<lel<---<le, 1, 正如 之 前 所 做 的 ， 
令 G(ei) 表 示 从 G = (V, E) F WIRA kbe, 长 的 边 而 得 到 的 图 。 理 想 地 ， 该 算法 将 测试 G(e)， 
C(e:)，…， 直 到 遇 到 第 一 个 G(ej )， 使 得 Ge ) 包 含 加 权 K 供 应 商 问题 的 一 个 可 行 解 ， 这 个 可 行 解 
一 定 是 最 优 的 。 遗 憾 的 是 ， 如 我 们 容易 想到 的 ， 确 定 一 个 图 是 否 包 含 加 权 K 供 应 商 问题 的 可 行 
解 是 一 个 NP 完全 问题 。 夫 此， 必须 修改 这 个 方法 来 得 到 一 个 近似 算法 。 

在 近似 算法 中 ， 将 使 用 一 个 测试 过 程 。 此 测试 过 程 满 足下 面 的 性 质 : 

C) 如 果 测 试 返回 “YES”， 那 么 输出 一 个 归纳 解 作为 近似 算法 的 解 。 

(2) 如 果 测 试 返回 “NO”， 那 么 可 以 确定 G(ei;) 不 含 任何 可 行 解 。 

如 果 测 试 过 程 没有 满足 上 面 的 条 件 ， 并 且 图 中 的 边 满 足 三 角 不 等 式 关 系 ， 那 么 可 以 很 容 
易 证 明 近似 算 法 将 会 产生 一 个 近似 解 ， 该 近似 解 的 值 小 于 或 等 于 最 优 解 值 的 三 倍 。 

令 V, 和 Vi 分 别 表 示 最 优 解 和 近似 解 的 值 。 根 据 性 质 (2), Alel Vapo 

此 外 ， 由 性 质 (1)， 原 因 将 在 后 面 解释 ， 得 到 

Vap < 3le,l 

因此 ， 有 V,, <3V,, o 

现在 解释 测试 如 何 。 想 象 任意 包含 可 行 解 的 G(e; )。 每 一 个 消费 者 项 点 必须 至 少 与 一 个 供 
应 商 顶 点 连接 ， 如 图 9-17 所 示 ，v, v2, y; 和 vs 是 供应 商 顶 点 ， 所 有 其 他 的 顶点 为 消费 者 顶点 。 
每 一 个 w 都 有 几 个 消费 者 顶点 与 它 相 连 。 郑 虑 图 9-17 所 示 图 Ge ) 的 G(e)。 

G(e;) 如 图 9-18 所 示 。 由 于 G(e;) 包 含 一 个 可 行 解 ， 每 个 消费 者 顶点 至 少 与 一 个 供应 商 顶 点 
相连 ，G(e;》 将 包含 几 个 团 。 在 一 个 团 中 ， 每 一 对 顶点 是 连通 的 。 


a 
y 1 2 
v 
vi 1 
+ 
\ DI 
人 A 


图 9-17 包含 一 个 可 行 解 的 C(e)) 图 9-18 图 9-17 的 G? 





可 以 从 每 个 团 中 选 一 个 消费 者 顶点 ， 此 结果 是 一 个 最 大 的 独立 集 。 图 G = (V, E) 的 独立 集 
(independent set) 是 使 FE 的 每 条 边 e 至 多 邻接 V' 中 一 个 顶点 的 子 集 V'CV。 图 的 一 个 最 大 独立 集 
(maximal independent set) 是 一 个 不 完全 包含 在 任何 独立 集中 的 独立 集 。 如 图 9-18 所 示 ，{y1， 
v, n, Vs 是 一 个 最 大 独立 集 。 在 找到 最 大 独立 集 之 后 ， 对 于 每 个 消费 者 顶点 v,'， 寻 找 一 个 与 
它 相连 的 最 小 权 值 的 供应 商 顶点 。 这 个 反 向 建立 的 供应 商 集 可 以 证 明 是 Ge 小 的 一 个 可 行 解 。 

测试 过 程 (关于 G(e,) 和 G(e;)* 的 ) 由 下 面 步骤 组 成 : 

(1) 如 果 在 Vi 中 有 顶点 vy， 与 Gle,) 中 的 任何 供应 商 顶 点 均 不 相 邻 ， 则 返回 “NO”。 

(2) 否则 ， 在 G(e; 六 的 Vs 中 找到 一 个 最 大 独立 集 5。 

(3) 对 于 8 中 的 每 个 顶点 v'， 找 到 G(e, ) 中 权 值 最 小 的 相 邻 供应 商 顶 点 v; 。 令 5' 为 这 些 顶 点 的 
集合 。 
(4) 如 果 5' 中 的 总 权 值 wv;) 小 于 或 等 于 ， 那 么 返回 “YES”; GU, RE “NO”, 
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AUR MIRE RAE “NO”, BAG ) 不 包含 任何 可 行 解 。 如 果 测 试 结果 是 “YES”， 那 么 可 
以 使 用 归纳 的 供应 商 集合 作为 近似 算法 的 解 。 因 此 ， 近 似 算法 如 算法 9-4 所 示 。 
算法 9-4 解决 特殊 瓶颈 k 供 应 商 问题 的 近似 算法 
输入 ;完全 图 G = (V.E), SERV = Vw UV Vers Wage = Os 与 ww 中 每 个 顶点 w 相 关 的 权 值 w(w)，C 中 所 有 的 
边 均 满足 -: 角 不 等 式 。 
输出 特殊 瓶颈 4 供应 商 问题 的 近似 解 ， 近 似 解 的 值 不 大 士 最 优 解 的 值 的 3 俯 。 





MI 将 E 中 的 边 排序 为 elstel<…<tevl, Heo m=(5). 

PR. i: = 0。 

步骤 3. i :=i+ 1。 

步骤 4. 如 果 存 VY, 中 存在 某 个 顶点 (是 消费 者 顶点 ) 与 Gle,) 中 的 任何 供应 商 顶点 均 不 相 邻 ， 转 向 步骤 3。 

步骤 5. 在 Gle; 六 的 Vi 中 找 出 最 大 独立 集 S。 对 十 S 中 的 每 个 顶点 by '， 找 到 一 个 供应 商 顶 点 v;, ，v 有 最 小 的 权 值 ， 
首 与 G(ej) 中 的 w 相 邻 ， 并 令 S Uve 

HME. MRIw(y,)>k, Heb, ES", MAP, 

步骤 7. 将 5S' 作 为 供应 商 集合 输出 。 

BMS. 对 十 Vi 中 的 每 个 顶点 v;, ， 令 DISTU ) 表示 vw 与 5' 之 间 的 最 短 距离 。 令 Vs = TODISTE), JAH, 。 


下 面 通过 一 个 例子 说 明 该 算法， 参见 图 9-15。 图 9-19 显 示 了 图 9-15 中 的 G(HD。 由 于 5 不 
与 G(HD 中 的 任何 供应 商 相 邻 ， 所 以 测试 的 结果 是 “NO”。 

在 图 9-20 中 显示 G(HC)。 由 于 HC 是 下 一 条 最 短 的 边 ， 图 9-21 显 示 了 G(HC)*。 假 设 在 
G(HC) 的 Vs 中， 选择 $ = {E,G}， 那 么 5'= {B, C}. WB) + W(C) =5<k=5, Wik, S'={B, 
C} 是 解 。 从 5' = {8, C} 中 ， 可 以 找到 每 个 消费 者 顶点 的 最 近 顶 点 ， 结 果 如 图 9-22 所 示 。 
DIST(E) = 16, DIST(F) = 14, DIST(G) = 12, DIST(H) = 16， DIST(D =21。 因 此 , V,,= 21. 


E B E G 4 H 15 1/ E 13 E G 14 H 15 J 
14 12 13 16 14 n 16 13 
14 14 
A B C D A B C D 








图 9-19 图 9-15 的 GC(H1) 图 9-20 图 9-15 的 G(HC) 
18 
E BOF G I E F G H I 
NNI ol 2 (i 16 14 12 16 21 
N . l 
A B C D A B C D 
图 9-21 GHC? 图 9-22 由 G(HC)》 得 到 的 归纳 解 


正如 之 前 所 做 的 ， 要 回答 下 面 三 个 问题 : 
(1) 近似 算法 的 时 间 复 杂 度 是 多 少 ? 
(2) 近似 解 的 界 是 什么 ? 





-2 4 了? 


(3) 该 界 是 最 优 的 吗 ? 

为 了 回答 第 一 个 问题 ， 可 以 简单 地 说 明 该 近似 算法 是 由 寻找 最 大 独立 集 需要 的 步骤 决定 
的 ， 这 是 一 个 多 项 式 级 的 算法 。 因 此 ， 这 个 近似 算法 是 多 项 式 算法 。 

现在 回答 第 二 个 问题 。 通 过 使 用 近似 算法 得 到 解 值 的 界 是 什么 ? Se 为 近似 算法 输出 的 
解 ，V 为 特殊 瓶颈 k 供 应 商 问 题 最 优 解 的 值 。 显 然 ，leil 和 Yw 。 此 外 ， 应 注意 在 近似 算法 步 又 
8 中 得 到 的 近似 解 的 值 为 ww 。 对 于 5 中 的 每 一 个 消费 者 顶点 v; ， 在 初始 供应 商 顶点 集中 找 一 个 
最 近邻 点 v; ， 这 些 最 近邻 点 形成 9 。 必 须 注意 到 连接 顶点 和 在 8 中 它 的 最 近邻 点 的 边 不 必 是 
在 G(e;》 中 的 边 。 例 如 ， 考 虑 图 9-22，BI 不 是 G(HC》 中 的 边 。 假 设 用 C 代 替 B 作 为 1 的 供应 商 顶 
点 。 那 么 应 该 注意 到 CI 也 不 是 G(HC)? 中 的 边 。 但 是 ，Yw = 1B11 必 须 小 于 等 于 ICI。 就 是 说 ， 
ICll 是 1BNI 的 上 界 。 因 此 ， 查 询 C1 属 于 哪个 G(HC)* 是 很 重要 的 。 在 下 面 将 证 明 CI 属 于 G(HC)、 
G(HC)* 或 者 G(HC) 。 

原因 如 下 : 对 于 算法 挑选 的 不 在 最 大 独立 集中 的 每 个 消费 者 顶点 v;, ， 令 vw 为 最 大 独立 集 
中 直接 与 vj 连接 的 顶点 。 这 样 的 vr” 必定 是 存在 的 ， 否则， 最 大 独立 集 就 不 是 最 大 独立 集 了 。 
如 图 9-23 所 示 ，v 必须 是 一 个 消费 者 顶点 ， 并 且 与 算法 步骤 5 中 确定 的 5' 中 的 供应 商 顶 点 v; 直 
接 相 连 。 现 在 ， Oy; vy" abe TEG(e, HH, REGE Y H. ESD, MNFRS PRR, V, vj) 
必须 在 G(e;) 中 。 因 此 ， 边 (vi, BETEGE), Gey RHG(e,) FP. BRER, MRA >3, W 
(vi, vj)) 在 G(e;)* 中 。 在 近似 算法 的 最 后 ，vj 可 能 与 某 一 vi 连接 ， 而 不 是 v; 。(vi vj) 必定 比 (vi, v) 
fis OM, BRAS. AK, 


V = viv, < lw», < le < 3V,, 


Yj Yj 






E 
在 最 大 独立 集中 f E 
的 消费 者 顶点 人 
在 Gle,) 和 Gle,》 


在 ee “在 G(ei), Ge) 和 Ge) 


“SS 中 的 供应 者 顶点 
图 9-23 特殊 瓶颈 k 供 应 商 问题 近似 算法 界 的 说 明 


最 后 的 问题 是 关心 这 个 限界 系数 3 的 最 优 性 。 将 证 明 要 降低 这 个 限界 系数 是 不 大 可 能 的 。 
如 果 可 能 ， 那 么 NP = P。 本 质 上 ， 要 证 明 ， 如 果 存 在 可 以 产生 特殊 瓶颈 k 供 应 商 问题 近似 解 的 
多 项 式 近 似 算法 D， 其 解 的 值 可 以 确保 小 于 a . V,, ， 其 中 a<3 且 V, 是 最 优 解 的 值 ， 那 么 P = NP。 

为 证 明 此 点 ， 利 用 的 NP 完全 问题 是 寻找 集合 问题 (hitting set problem) 。 可 以 证 明 ， 如 果 
上 述 的 近似 算法 D 存 在 ， 那 么 可 以 用 算法 D 解 决 该 寻找 集合 问题 ， 这 隐 含 着 P = NP, 

寻找 集合 问题 (hitting set problem) 定义 如 下 : 已 知 有 限 集 S 和 5 的 子 集 的 合集 C 以 及 一 个 
正 整 数 :。 是 否 存 在 子 集 5' C5， 其 中 IS'1<k， 对 于 C 中 的 任何 $;: 有 S'S; + 9. 

例如 ， 令 

S={1, 2,3,4, 5} 

C={{1,2,3}, {4,5}, {1, 2, 4, {3, 5}, {4,5}, {3, 4}} 

以 及 k= 3, 

BAS 1 3 4) 有 这 样 的 性 质 ， 1S1=3<k， 以 及 对 于 C 中 的 每 个 5; 有 S'S5; +. 

为 了 说 明 此 目的 ， 将 称 寻 找 集合 问题 为 k 寻 找 集 合 问 题 ， 以 强调 参数 k。 

给 定 一 个 k 寻 找 集合 问题 的 实例 ， 将 这 个 例子 转换 一 个 特殊 瓶颈 k 供 应 商 问 题 的 实例 。 假 
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WS = {a,, a, …, a, }, 那么 令 V,,。 = {v Vo …, Vs}， 其 中 每 个 v; 对 应 一 个 a; 。 假 设 C = {51, S,, 
Sky BAS Vasi = Yaa is Yno Va4tm}， 其 中 v1 对 应 $5;。 定 义 每 个 供应 商 顶 点 的 权 值 为 
1, v, Sv, 之 间 的 距离 定义 如 下 ; 
dj =2 如 果 {v， Vj +c V up ， 或 者 {v;， V; } EVs 
= 3 如 果 v, EV... vj EV, Ha; ES; 
=] 如 果 w EV up v EV awo Ha; ES; 
直接 证 明 这 些 距离 满足 三 角 不 等 式 ， 以 及 k 供 应 商 问 题 有 一 个 代价 为 1 的 解 ， 当 且 仅 当 存 
在 一 个 k 寻 找 集合 S'。 此 外 ， 如 果 没 有 Kk 寻找 集合 ， 那 么 最 优 K 供 应 商 的 代价 必定 是 3。 因 此 ， 如 
果 一 个 近似 算法 确保 近似 解 V,, ， 其 中 VV, <3V,, ， 那 么 V, <3， 当 和 且 仅 当 V,, = 1， 并 且 有 一 个 
寻找 集合 。 就 是 说 ， 可 以 用 这 个 多 项 式 近 似 算法 解决 是 NP 完 全 问题 的 寻找 集合 问题 ， 这 更 涵 
了 NP = P。 


9.5 装 箱 问题 的 近似 算法 


Co AL = {alll<i<n,，0<a 所 1} 中 的 n 件 物品 清单 ， 将 它们 放 在 单位 容量 的 若干 箱子 中 ， 
那么 ， 装 荐 问题 就 是 确定 包含 所 有 n 件 物品 的 荐 子 最 小 的 数量 。 如 果 将 不 同 大 小 的 物品 看 作 是 
在 标准 处 理 器 上 执行 不 同 作业 的 时 间 长 度 ， 那 么 该 问题 变 为 在 固定 时 间 内 完成 所 有 作业 ， 所 
使 用 最 少 处 理 器 的 问题 。 例 如 ， 令 L = {0.3, 0.5, 0.8, 0.2, 0.4}， 如 图 9-24 所 示 ， 至 少 需要 三 个 
箱子 来 装 这 5 件 物品 。 

由 于 可 以 方便 地 将 分 割 问题 转化 为 这 个 问题 ， 
那么 装 箱 问题 是 NP 难 的 。 下 面 将 介绍 装 箱 问题 的 近 “上 
似 算法 。 are 
近似 算法 称 为 最 先 适 应 算法 (first-fit algorithm), | 
令 所 要 的 箱子 标 以 !:，2，…，m 下 标 ，B, 表示 第 一 
个 箱子 的 容量 。 最 先 适应 算法 将 物品 放 入 箱子 ， 以 
下 标 递 增 的 方式 ， 一 次 一 件 物品 。 为 了 放 物 品 a; ， 
最 先 适应 算法 总 是 将 它 放 入 下 标 最 小 的 箱子 中 ， 已 
经 放 入 该 箱子 中 物品 大 小 的 总 和 不 能 超过 1 减 去 w 的 大 小 。 

最 先 适 应 算法 是 很 自然 的 ， 并 且 易 于 实现 。 剩 下 的 问题 是 算法 如 何 近 似 装 箱 问题 的 最 优 解 。 

令 物 品 a; 的 大 小 表示 为 S(a; )。 每 个 箱子 有 一 个 单位 容量 ， 问 题 实例 / 的 最 优 解 的 大 小 表示 
为 OPTU)， 大 于 等 于 所 有 物品 大 小 之 和 的 上 限 ， 即 


orn > |$ sta) 

令 FF(D 为 最 先 适应 算法 中 所 需 箱子 的 数量 。FF(D = m。FF(D 的 上 界 可 推导 如 下 选任 意 
箱子 B, ， 令 C(B,) 为 放 到 箱子 B, 中 a 的 尺寸 之 和 。 那 么 

C(B;) + C(B;, ,)>1 

否则 ，B,, ,中 的 物品 会 放 入 B, 中 。 将 所 有 的 m 个 非 空 箱子 加 起 来 ， 有 

C(B,) + C(B,) + + C(B,,)>m/2 

也 就 是 说 


FF(D)=m< ($ cm] = [$ sa| 








图 9-24 装 箱 问题 的 例子 
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因此 ， 推 导出 
FF(D<20PT(D) 


9.6 直线 m 中 心 问题 的 最 优 近似 算法 


已 知 平面 上 nt 个 点 的 集合 ， 直 线 贡 中 心 问 题 (rectilinear m-center problem) FRA 3 if 
有 这 nn 个 点 的 m 个 直线 方形 ， 使 得 这 些 方形 的 最 大 边 长 最 乱 。 直 线 方形 是 边 垂直 或 平行 于 欧 几 
里 得 平面 x* 轴 的 方形 。 因 为 对 于 直线 m 中 心间 题 的 解 中 可 以 扩大 较 小 的 方形 到 最 大 边 长 的 方形 
而 不 影响 目标 ， 假 设 在 一 个 解 中 所 有 m 个 方形 的 边 长 相等 。 边 长 称 为 解 的 大 小 。 

图 9-25 给 出 直线 5 中 心 问题 的 例子 。 用 “+” 
标记 中 心 点 被 5 个 直线 方形 所 覆盖 。 图 中 所 示 的 5 个 
直线 方形 形成 其 最 优 解 。 

直线 m 中 心 问题 已 被 证 明 是 NP 难 的 。 此 外 已 证 
明 ， 除 非 NP = P， 那 么 解决 该 问题 的 任何 多 项 式 时 
间 近 似 算法 的 误差 比 关 2。 在 本 节 中 ， 将 介绍 一 个 
误差 比 精确 地 等 于 2 的 近似 解 。 

注意 ， 关 于 已 = {P，P2，…， p;} 的 直线 m 中 心 
问题 的 任意 最 优 解 ， 解 的 大 小 必定 等 于 输入 点 间 的 
直线 距离 之 一 。 也 就 是 说 ， 最 优 解 的 大 小 必定 等 于 
Lis pi) 之 一 ,1 <&i<j<n, KPL Y), Or, 
yd) = max{Ix,—x2l, ly yal}, RNR EEE AN 图 9-25 直线 5 中 心 问题 的 例子 
个 点 ， 长 为 r? 的 m 个 方形 ， 那 么 数 r 是 可 行 的 。 一 个 
解决 直线 mm 中心 问题 的 直接 方法 如 下 : 

(1) 计算 所 有 可 能 的 Ls O, P) 1<i<j<n, 

(2) 排序 上 面 计 算得 到 的 距离 ， 将 其 表示 为 : Pl1]<D[2]<…<Dln(n-1)12]。 

(3) 对 于 D{ 站 进行 折 半 查找 ，i = 1!，2，…，n(n 一 1M2， 找 到 最 小 的 索引 值 ;， 使 得 D[io] 是 
可 行 的 ， 且 D[il 的 大 小 是 可 行 解 。 对 于 查找 的 每 个 距离 D 四 ， 要 测试 D 了 外 是 否 可 行 。 

测试 距离 仅 为 O(log n)。 然 而 ， 对 于 每 个 D[i]， 是 否 存 在 覆盖 所 有 nn 个 点 具有 边 长 为 Di 的 
mm 个 方形 仍然 是 一 个 NP 完全 问题 。 因 此 ， 正 如 所 希望 的 ， 至 少 对 于 时 间 来 说 ， 上 面 算法 的 界 
是 指数 级 的 。 

在 本 节 中 ， 将 介绍 用 在 近似 算法 中 的 “松弛 ” 视 试 子 程序 。 已 知 平 面 上 rn 个 点 的 集合 ， 以 
及 两 个 输入 参数 m 和 r， 该 松弛 测试 子 程序 产生 边 长 为 2r， 而 不 是 r 的 m 个 方形 。 此 时 ， 测 试 是 
否 访 个 方形 覆盖 这 nm 个 点 。 如 果 失 败 ， 那 么 将 会 返回 “失败 ” 。 如 果 成 功 ， 那 么 返回 大 小 为 27 的 
可 行 解 。 随 后 将 看 到 “失败 ”确保 没有 边 长 为 ?的 m 个 方形 可 以 覆盖 这 n 个 点 。 

后 面 将 给 出 这 个 子 程序 的 细节 。 令 Test(m，P，r) 表 示 这 个 松弛 子 程序 。 近 似 算 法 是 以 上 
面具 有 松弛 算法 中 的 简单 最 优 算法 来 代替 测试 子 程序 的 算法 。 


算法 9-5 直线 m 中 心 问题 的 近似 算法 
输入 : 有 个 点 的 集合 P 及 中 心 数 历 。 





WH: SO, =. SOn: 直线 m 中 心 问题 的 一 个 可 行 解 ， 该 解 的 规模 小 十 或 等 于 最 优 解 的 两 倍 。 
步骤 1. 计算 所 有 的 点 对 之 问 的 直线 距离 ， 并 将 其 升序 排列 为 DI01 = 0, DHI, = Din(n—1)/2), 
步骤 2. LEFT: = 1, RIGHT: = n(n-1)/2, 


步骤 3. i: = [(RIGHT + LEFT)/2]。 
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步骤 4. If Teston, P, DUPRE “KR” then 
RIGHT: =i 
else 
LEFT: = i, 
步骤 5. If RIGHT = LEFT+\ then 
Return Testun, P, D|RIGHT}) 
else 


go to 步骤 3。 


现在 描述 松弛 测试 子 程序 Test(m，P，7) 如 下 : 

(D 在 剩余 的 没有 被 覆盖 的 点 中 找 出 x 值 最 小 的 点 ， 以 该 点 为 中 心 画 一 个 边 长 为 2r 的 方形 。 

(2) 在 解 中 添加 这 个 方形 ， 并 且 移出 所 有 已 经 被 这 个 方形 覆盖 的 点 。 

(3) 将 步骤 1 和 步骤 2 重复 关 次 。 如 果 成 功 找到 覆盖 所 有 输入 点 的 mm 个 方形 ， 那 么 返回 这 产 个 
FEAT AAR, GW, RE “RR. 


算法 9-6 MikTest(m, P, r) 
MA: 点 集 P， 中 心 数 户 ， 大 小 r。 
输出 :“ 和 失败”， 或 者 SC111，…，SOlml， 覆 盖 P 的 大 小 为 2r 的 mm 个 方形 。 
步骤 1. Ps: =P 
步骤 2. For i: = 1 to m do 
If PS ¢@ then 
P := PS 中 具有 最 小 x 值 的 点 
SQ\il: = 中 心 为 p， 大 小 为 2r 的 方形 
PS: = PS-{ 被 SCHI 巴 盖 的 点 } 
else 
SQUI: = Se 一 1 。 
PR. If PS = pthen 
return SQ[I], =, SQ{m] 
else 


return “We”, 


再 次 考虑 图 9-25 中 的 直线 5 中 心 问题 。 令 7 为 图 9-25 中 方形 的 边 长 。 对 于 该 实例 ， 对 参 
数 "应 用 松弛 测试 子 程序 ， 先 找到 * 值 最 小 的 点 Pi， 然 后 画 出 以 边 长 为 2r、 疡 为 中 心 的 方形 
Si ， 如 图 9-26 所 示 。 然 后 移出 被 89, 覆盖 的 所 有 点 。 在 剩 下 的 点 中 ， 找 到 x 值 最 小 的 点 px， 再 
次 画 出 以 边 长 为 2r、p; 为 中 心 的 方形 5,， 然 后 移出 被 3, 覆 盖 的 所 有 点 ， 如 图 9-27 所 示 。 将 
上 面 的 步骤 重复 5 次 。 最 后 ， 得 到 一 个 可 行 解 ， 如 图 9-28 所 示 。 在 这 个 例子 中 ，4 个 方形 就 
足够 了 。 

接 下 来 证 明和 近似 算法 的 误差 率 为 2。 主 要 声明 如 + 
F: 如 果 r 是 可 行 的 ， 那 么 松弛 测试 子 程 序 Test(m， 


ts 
S 


P, 总 是 会 返回 一 个 大 小 为 2 的 可 行 解 。 假 设 上 面 
的 说 法 是 正确 的 。 令 r* 是 最 优 解 的 大 小 。 由 于 r* 是 " 
可 行 的 ， 根 据 上 面 和 的 声明 ， 子 程序 Test(m, P, r) ” + + 


将 返回 一 个 可 行 解 。 由 于 近似 算法 至 少 会 在 "终止 ， 
这 样 的 Test(m，P，r) 返 回 一 个 大 小 为 2r 的 可 行 解 ， 
得 到 r<r* 。 因 此 ， 这 个 可 行 解 的 大 小 为 2r， 小 于 等 
于 2rx* 。 也 就 是 说 ， 误 差 率 为 2。 图 9-26 松弛 测试 子 程序 的 第 一 次 应 用 
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P3 
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图 9-27 松弛 测试 子 程序 的 第 二 次 应 用 图 9-28 直线 5 中 心 问题 的 一 个 可 行 解 
下 面 , 证 明 上 述 的 说 法 。 令 $1,，5,，…，5 为 大 小 为 ?的 可 行 解 ，5,'"，…，5' 为 在 子 程序 
Test(m，P，7) 中 产生 的 边 长 为 2r 的 m 个 方形 。 如 果 51'"，…，5' 互 不 区 别 ， 那 么 在 子 程序 Test 
的 步骤 2 中 PS = $。 也 就 是 说 ， 在 这 种 情况 下 ，5,'，…，5。' 总 是 覆盖 所 有 点 ， 并 形成 一 个 可 
行 解 。 下 面 考虑 $1'，…，5,' 是 相互 区 别 的 情况 。 令 8 的 中 心 为 pi = 1, 2, +, m, HR 


$,' 中 的 任意 点 到 p,' 的 直线 距离 都 小 于 等 于 r。 这 样 ， AHS, , P; 不 被 51'， “Ty Sa 所 覆盖 。 因 
此 ， 对 于 所 有 ;六 有 L (pi'， PPr. 由 于 对 i = l, Tta m, $ 的 边 长 为 r， S 中 任何 两 个 点 之 
间 的 直线 距离 小 于 等 于 r。 所 以 ， 任 何 8 至 多 包含 一 个 p'，i = 1，…，m。 另 一 方面 ， 由 于 形 


BoA ATT ARS,, So, +, S, 的 并 包含 了 pi'，…，p。'。 因 此 ，p;' 属于 不 同 的 5, ， 也 就 是 p;' ES, 。 
对 于 1 <i<m， 由 于 5 的 大 小 为 "， 对 于 所 有 的 p ES; ALe, pi) Sre XE, S CS; (图 9-29)。 
AEE, Sh e, Sa 包含 所 有 的 点 ， 可 以 得 出 上 面 的 声明 。 根 据 上 面 的 说 法 ， 也 可 以 有 下 面 的 
等 价 描述 ， 

如 果 Test(m，P，r) 没 有 返回 一 个 可 行 解 ， s, 
那么 "是 不 可 行 的 。 


ERE9-5H, FRIAS OPT AOE il 
AO(n? log n), RIAIT le] AOCog n). 
测试 中 步骤 3 到 步骤 5 的 循环 时 间 为 O(mn)。 
因此 ， 我 们 得 到 误差 率 为 2 的 直线 m 中 心 问题 
的 近似 算法 的 时 间 复 杂 度 为 O(n log n). 


9.7 多 序列 比 对 问题 的 近似 算法 


在 第 7 章 中 只 研究 了 两 个 序列 间 的 比 对 。 
很 自然 地 ， 扩 展 该 问题 成 为 超过 2 个 序列 的 多 图 9-29 S; C 8 的 解释 
序列 比 对 间 题 (multiple sequence alignment problem ) 。 考 虑 下 面 涉及 3 个 序列 的 情况 。 

S, = ATTCGAT 

S, =TTGAG 

S, = ATGCT 
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这 三 个 序列 的 - -个 非常 好 的 比 对 表示 如 下 : 
S, = ATTCGAT 
S, = -TT-GAG 
S, = AT--GCT 


注意 ， 序 列 中 的 每 一 对 之 间 的 比 对 都 是 非常 好 的 。 

多 序列 比 对 问题 类 似 于 两 序列 的 排序 问题 。 代 赫 基本 得 分 函数 olx，y)， 必 须 定义 一 个 包 
含 多 个 变量 的 得 分 函数 。 假 设 有 三 个 序列 ， 不 是 考虑 a; 和 b, ， 现 在 必须 考虑 a; b 和 ct 。 这 
就 是 说 ， 必 须 定义 一 个 olx，y，z)， 还 必须 找到 4(i，j， 人 D。 当 确定 了 A(i，j， 有 ) 时 ， 需 要 考 
ETE 

Ali=1, j, k), AG, j-1, k), Ali, j, k-1), Ali—1, j-1, k) 

Ali, jl, k-1), Ali~1, j, k-1), A(@i-1, j-1, k-1) 


在 2 序列 间 定义 一 个 线性 得 分 函数 。 已 知 个 输入 序列 ， 成 对 的 多 序列 比 对 问题 得 分 总 和 
是 找到 这 k 个 序列 的 比 对 ， 使 得 其 中 所 有 成 对 的 序列 比 对 得 分 总 和 最 大 。 如 果 输 入 的 序列 数量 
k 是 可 变 的 ， 那 么 这 个 问题 已 被 证 明 是 一 个 NP 难 的 。 因 此 ， 没 有 太 大 希望 使 用 多 项 式 算法 来 解 
决 这 个 成 对 的 多 序列 比 对 问题 的 总 和 ， 所 以 近似 算法 是 必需 的 。 在 本 节 中 ， 将 介绍 一 个 由 
Gusfield 提 出 的 近似 算法 ， 来 解决 成 对 的 多 序列 比 对 问题 的 和 。 

考虑 下 面 的 两 个 序列 : 

S, = GCCAT 

9 = GAT 

这 两 个 序列 之 间 的 一 种 可 能 的 比 对 是 

S,' = GCCAT 

S,' = G--AT 

对 于 这 个 比 对 ， 有 三 个 准确 的 匹配 和 两 个 不 匹配 。 如 果 x = y, WAEL, y)= 0; 如 
x+y, 那么 定义 ofx， y= l, 对 于 比 对 9 = a,', a,', wy a, 和 Ss = b,', b,', wy b,', 由 该 
比 对 导出 的 两 个 序列 之 间 的 距离 定义 为 


2 olab) 


读者 可 以 容易 地 理解 这 个 记 为 d(S ，5, ) 的 距离 函数 有 下 面 的 特性 ， 

(1) d(S;, 5;)=0 

(2) d(S; , S,)+d(S,, S, )2d(S;, S,) 
第 二 个 性 质 称 为 三 角 不 等 式 。 

需要 强调 的 另 一 点 是 对 于 2 序列 比 对 ， 比 对 (-，-) 永 远 不 会 出 现 。 但 是 ， 在 多 序列 比 对 中 ， 
可 能 有 “-” 与 “-” 的 匹配 。 考 虑 如 下 的 S$,，5, 和 5，: 

S, = ACTC 

S, = AC 

S, = ATCG 


首先 比 对 $5, 和 5 如 下 : 
S, = ACTC 
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S, = A--C 

然后 假设 比 对 5, 和 5; 如 下 : 
S, = ACTC- 

S, = A-TCG 

三 个 序列 最 终 比 对 如 下 : 
S, = ACTC- 

S, = A--C- 

S, = A-TCG 


Z, “-” BS” RT AK. SASS LE, “-” SNS EARS h. 

已 知 两 个 序列 8 和 3 ， 最 小 的 比 对 距离 表示 为 D(5; ，$; )。 现 在 考虑 下 面 的 四 个 序列 。 首 
先 找到 与 其 他 所 有 序列 的 最 短 距离 序列 

S, = ATGCTC 

S, = AGAGC 

S, = TTCTG 

S, = ATTGCATGC 

将 这 四 个 序列 按 对 进行 比 对 。 

S, = ATGCTC 

DS, ? S3) = 3 
S, = A-GAGC 
S, = ATGCTC 








D(S, , 53) =3 
S, = TT-CTG 


S, = AT-GC-T-C 








DS, 9 S4) =3 
S, = ATTGCATGC 


S, = AGAGC 





D(S,, S3) =5 
S, = TTCTG 


S, = A--G-A-GC 








DS), S4) =4 
S, = ATTGCATGC 


S, = -TT-C-TG- 





D(S,, S4) = 4 
S, = ATTGCATGC 
然后 得 到 
D(S,, S,) + D(S,, S) + D(S,, S)J=34+34+43=9 
D(S>, S) + D(S,, S;)+ D(S,, $1) =3+5+4=12 
D(S;, S) + D(S;, $2) + D(S;, $8) =34+5+4+4= 12 
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D(S,, Si) + D(S4, S) + D(S,, $:)=34+44+4= 11 


可 以 看 出 8 相对 于 其 他 所 有 序列 具有 最 短 距离 ， 称 8, 与 其 他 所 有 序列 最 相似 ， 称 这 个 序列 
为 序列 的 中 心 (center of sequencen) 。 下 面 正式 地 定义 这 个 概念 。 
已 知 有 k 个 序列 的 集合 S$， 序 列 集 的 中 心 是 使 下 面 最 小 的 序列 。 


D(S;,X) 
xB) 
共有 K(k 一 1)/2 对 序列 ， 每 -对 通过 动态 规划 方法 比 对 ， 显 然 找到 中 心 花 费 多 项 式 时 间 ， 近 
似 算法 如 算法 9-7 所 示 。 


算法 9-7 ”寻找 成 对 的 多 序列 比 对 问题 总 和 近似 解 的 2 近似 算法 

输入 : 人 个 序列 。 
输出 : 性 能 比 不 大 十 2 的 人 证 列 比 对 。 
PRI 找到 这 k 个 序列 的 中 心 。 不 失 “ 般 性 ， 可 以 假设 S 是 中 心 。 
步骤 2. Fi=2, 
步骤 3. While i<k 

TES ANS HIRR BRULEE tH 

必要 的 话 ， 在 已 比 对 的 序列 S$,，3$:，…，3 中 添加 空格 。 

i=i+l ， 

End while 

步骤 4. 输出 最 终 的 比 对 。 


考虑 上 面 讨 论 的 4 个 序列 ， 

S, = ATGCTC 

S, = AGAGC 

S, = TTCTG 

S, = ATTGCATGC 

如 前 所 述 ， $l 是 中 心 。 比 对 5 与 5, 如 下 : 
S, = ATGCTC 

S, = A-GAGC 

通过 5 与 5, 比 对 添加 5;。 

S, = ATGCTC 

S, = -TTCTG 

因此 ， 比 对 变 为 : 

S, = ATGCTC 

S, = A-GAGC 

S, = -TTCTG 

Hit S, 5S, LEMAR AMS, 

S, = AT-GC-T-C 

S, = ATTGCATGC 

此 次 ， 添 加 空格 到 已 比 对 的 5, 中 。 因 此 ， 必 须 在 比 对 5, 和 5; 中 添加 空格 。 最 终 的 比 对 如 下 : 
S, = AT-GC-T-C 
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S, = A--GA-G-C 
S, = -T-TC-T-G 
S, = ATTGCATGC 


可 以 看 到 ， 这 是 一 个 相对 于 3， 所 有 序列 比 对 的 典型 近似 算法 。 令 d(S; ，5) RRS AS 之 间 
由 近似 算法 推导 出 的 距离 ， 令 App = > Sas, 5,) ，dx(S, ，5) ) 表 示 3 AUS, 之 间 的 由 最 优 多 序 


t= a 


列 比 对 计算 的 距离 ， Fon Bact ,S;) 。 现 在 证 明 App < Opt。 


在 正式 证 明之 前 ，d(5,， 5) = DS,, 5;)。 由 上 面 的 例子 可 以 检验 出 。 
S, = ATGCTC 
S, = A-GAGC 
因此 ，D(5S,，5,) = 3。 在 算法 的 结束 处 ，5, 和 5, 比 对 如 下 : 
= AT-GC-T-C 
= A--GA-G-C 
ABZ, d(S,, S.)=3=D(S,, S). MF, -)=0, MUKTERRAKE. 
下 面 是 4pp 和 20Opt 的 证 明 : 


k k 
App = > 2 4.5) 
im im 


jai 
k k 


< d(S,,S,)+d(S,,S;) 三 角 不 等 式 
>> 1) + d(S, 角 不 等 式 


= 2k -DY dS, S) (d(S,,8,) = d(S,,5,)) 
对 于 所 有 的 tf， 由 于 d(S,，8) = DCS8,，8)， 有 


k 
App< 2k =) ¥ D'S) 0.1) 


现在 找 出 opi- $ Sans, ,3 ) 。 首 先 注意 D(S; ，5; ) 为 一 个 最 优 2 序 列 比 对 归纳 出 的 距 


iw | 


离 。 因 此 ， 
DS; , S; )<d+(S,, S;) 
以 及 


k k 


Opt = > yar S,) 


ini 
k 


> 5 $ D.S) 
i= j= 


jai 
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但 是 3 是 中 心 。 因 此 ， 


k k 
Opt YY PS. S,) 
is Ri 
k k 
>X, PSS) 
i=] j= 


k 
=k¥ D(S,,S;) 
2 (9-2) 


HER (9-1) WR (9-2)， 得 到 App <20pt。 
9.8 对 换 排 序 问题 的 2 近似 算法 


在 本 节 中 ， 将 介绍 通过 比较 两 个 染色 体 的 对 换算 法 排序 。 我 们 可 以 简单 地 把 染色 体 看 作 
是 一 个 基因 序列 ， 基 因 在 序列 中 的 次 序 是 非常 重要 的 。 因 此 ， 在 本 节 中 ， 将 每 个 基因 用 一 个 
整数 表示 ， 染 色 体 用 整数 序列 表示 。 

两 个 染色 体 的 比较 是 很 重要 的 ， 提 供给 我 们 对 于 物种 在 遗传 学 上 亲 朴 远近 的 内 部 了 解 。 
如 果 两 个 染色 体 很 相似 ， 那 么 它们 在 遗传 学 来 讲 是 相近 的 ， 否 则 不 是 相近 的 。 这 里 的 问题 是 
如 何 测量 两 个 染色 体 的 相似 度 。 本 质 上 说 ,通过 某 些 操 作 将 一 个 染色 体 转换 为 另 一 个 的 难 易 
程度 来 量度 两 个 染色 体 的 相似 度 。 在 本 节 将 介绍 一 种 操作 ， 也 就 是 对 换 (transposition)。 

由 于 将 一 个 数字 序列 转换 为 另 一 个 序列 ， 不 失 一 般 性 ， 可 以 假设 目标 序列 为 1，2，…,，n。 
对 换 在 不 改变 两 个 子 串 次 序 的 情况 下 ， 交 换 任 意 长 度 的 两 个 相 令 子囊。 下面 是 描述 这 个 操作 
的 一 个 例子 。 

染色 体 X: 3 1524 一 PAY: 32415 

通过 将 一 个 序列 转换 为 另 一 个 序列 所 需 的 最 小 操作 数 来 定义 两 个 序列 的 相似 度 。 由 于 目标 
序列 总 是 1，2，…，n， 可 将 这 个 问题 看 为 一 个 排序 问题 。 但 这 并 非 我 们 所 熟悉 的 普通 排序 问 
题 而 是 找到 要 求 排序 一 个 序列 的 特定 操作 的 最 小 数目 。 因 此 ， 这 个 排序 问题 是 一 个 优化 问题 。 

考虑 序列 1 4 5 3 2。 可 以 通过 对 换 将 这 个 序列 排序 为 : 

14532 

13245 

12345 

现在 开始 介绍 对 换 排序 。 首 先 ， 尽 管 现在 讨论 排序 ， 可 是 输入 是 不 同 于 一 般 的 排序 输入 。 
它 必须 满足 下 面 的 条 件 : 

(1) 输入 序列 不 能 包含 两 个 相同 的 数字 。 例 如 ， 不 能 包含 两 个 5。 

(2) 在 输入 序列 中 不 能 出 现 负数 。 

(3) 如 果 序 列 中 出 现 了 ;和 yj， 并 且 i<k<j ， 那 么 k 必 须 出 现在 序列 中 。 也 就 是 说 ， 不 允许 5 
和 7 出 现 了 ， 而 6 却 没有 出 现 。 

总 之 ， 可 以 简单 地 定义 输入 为 1 ，2，…，n 的 一 个 排列 。 也 就 是 ， 输 入 的 染色 体 是 由 排列 
T= yy, BARA. ARID AH ELA, = 0 入 , ,1 = n+1, 其 原因 将 在 后 面 介绍 清楚 。 例如 ， 
一 个 典型 的 输入 排列 为 0 24 1 3 5。 

对 于 排列 x， 对 换 记 为 p(i，j， 习 (对 于 所 有 1<i<j<n +1， 以 及 所 有 的 1<k<n +1， 有 
k€{i, jl), KAAPTEN, my ，…， Ni 和 zw， THs “os Mere 例如 ， 排 列 0723615 
4 8 中 的 p(2，4，6) 是 交换 子囊 (2 3) 和 (6 1)， 结 果 为 0 7 6 1 2 3 5 4 8。 已 知 排列 以 及 对 换 p，p 
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对 zt 的 应 用 记 为 p - r。 

对 换 排 序 问题 正式 定义 如 下 ; 已 知 两 个 排列 x 和 co， 对 换 排序 问题 (sorting by 
transposition problem) 是 找到 一 系列 对 换 p,|，p,，，…，p, ， 使 得 p, …p .pi * a =0, HALE 
最 小 的 。! 称 为 x 和 o 之 间 的 对 换 距离 (transposition distance)。 如 前 所 述 ， 不 失 一 般 性 ， 假 设 o 
总 是 以 (0，1，2，…，n，n +1) 形 式 的 一 致 排列 。 接 下 来 ， 将 介绍 对 换 排序 问题 的 2 近似 算法 ， 
该 算法 由 Bafna 和 Pevzner 于 1998 年 提出 。 注 意 对 换 排序 问题 的 复杂 度 到 目前 是 未 知 的 。 

在 排列 中 ， 对 于 所 有 的 0<i<n， 如 果 z; arm +1， 那 么 在 zi 与 zw 之 间 有 一 个 分 界 点 
(breakpoint), 。 例 如 ， 对 于 排列 0 2 3 1 4 5 添加 分 界 点 之 后 为 0，2 3，1，4 5。 一 个 有 序 的 排列 
不 包含 分 界 点 。 没 有 分 界 点 的 排列 称 为 一 致 排列 (identity permutation)。 因 此 ， 我 们 将 输入 
排列 排序 为 一 致 排列 。 

由 于 -- 致 排列 是 没有 分 界 点 的 排列 ， 所 以 对 排列 排序 相当 于 减少 分 界 点 数 。 令 d( 台 表示 将 
7 转换 为 一 个 一 致 排列 所 需要 的 最 小 对 换 数 。 每 一 次 对 换 至 多 减少 三 个 分 界 点 ， 因 此 ，d( 双 的 
通常 下 界 为 

(zx 中 分 界 点 的 个 数 ) /3 | 

7 的 循环 图 表示 为 G(z)， 是 顶点 集 {0，1，2，…，n，n+1} 的 有 向 边 荐 色 图 ， 边 集 定义 如 
下 。 对 于 所 有 的 1<i<n +1， 灰 色 的 边 是 由 i 一 1 到 i 的 边 ， 黑 色 的 边 是 从 到 太 _ ,的 边 。 图 9-30 是 
循环 图 的 一 个 例子 ， 虚 线 和 实 线 的 绝 分 别 代表 灰色 和 黑色 的 边 。 

着 色 图 的 交替 环 (alternating cycle) 是 相 邻 的 每 对 边 是 不 同 颜 色 的 环 。 对 于 G(7z) 中 的 每 
个 顶点 ， 每 一 条 入 边 与 唯一 的 不 同 关 色 的 出 边 成 对 。 因 此 ，G(7) 的 边 集 可 以 分 解 为 交 赫 环 。 
图 9-30 是 循环 图 分 解 为 交替 环 的 例子 ， 该 交替 环 如 图 9-31 所 示 。 





Foose 1 ty 5.23 2 3 ‘4 6 
04-3 4 3 a4 6 46-45 和 2443 
图 9-30 排列 0 1 4 5 2 3 6 的 循环 图 图 9-31 循环 图 分 解 为 交替 环 


用 k 环 (k-cycle) 表示 包含 k 条 黑色 边 的 交替 环 。 如 果 k>>2， 称 k 环 是 长 的 ， 否 则 称 为 短 的 。 
长 交替 环 和 短 交 替 环 的 两 个 例子 如 图 9 32 所 示 。 图 9-33 是 一 致 排列 的 循环 图 


0 Iata 5 «úda: 3t 6 0 at 2 u5 4 ay; 6 


a) 长 交替 坏 
0 ú 1 a ON 
2 5 4 3 
b) 短 交替 坏 


图 9-32 长 交替 循环 和 短 交 替 循 环 





EEEE 227 


wal 4 at 5 «44 6 


` ‘ ` 
’ 


0 +43 1 +! ‘e—1 3 


图 9-33 一 致 排列 的 循环 图 


如 图 9-33 所 示 的 一 致 排列 中 ， 每 个 顶点 zx 通过 一 条 灰色 的 边 连接 到 另 一 个 顶点 y， 且 顶点 y 
通过 黑色 的 边 连接 回 点 5， 称 这 种 类 型 的 循环 图 是 规则 的 (regular) 。 对 换 排 序 问题 是 将 一 个 
不 规则 的 循环 图 转换 为 规则 的 循环 图 。 

由 于 总 在 处 理 交 赫 环 ， 所 以 将 交替 环 简称 为 环 。 在 G( 允 中 至 多 有 n +1 个 环 ， 并 且 仅 有 7 +1 个 
环 的 排列 是 一 致 排列 。 对 于 排列 x， 将 G( 区 中环 的 个 数 表示 为 (区 。 因 此 ， 将 排序 是 将 环 的 个 数 
申 c( 双 增加 到 n +1。 同 样 对 于 排列 zx 将 由 对 换 p 产 生 的 环 个 数 的 变化 表示 为 Ac(p) = cpr). 

考虑 下 面 的 排列 : 

034125 

假设 将 子 串 (3 4) 和 (1 2) 对 换 ， 如 前 面 所 表示 的 ， 得 到 : 

012345 

读者 可 以 明显 地 看 到 上 面 的 对 换 是 非常 理想 的 。 最 初 的 排列 有 三 个 分 界 点 。 对 换 之 后 ， 
没有 分 界 点 。 这 可 以 通过 交 赫 环 图 加 以 解释 ， 假设 对 换 为 p(i，j，h)， 并 且 涉 及 G(zn) 排 序 的 相 
PTR, Bla, m, 五 1， 五 ， 五 由 及 在 一 个 环 内 如 图 9-34 所 示 。 


’ ` 


AIT I 








Ti TT Tank THT TaTTi Tja Tk 


图 9-34 对 换 Ac(p) = 2 的 一 个 特例 
如 图 9-34 所 示 ， 这 类 特殊 的 对 换 将 环 的 个 数 增加 了 两 个 。 因 此 ， 得 到 更 好 的 下 界 d(zm) = 
EAN, 任何 一 个 产生 与 下 界 EC 相等 的 对 换 距 离 的 对 换 排序 算法 一 定 是 一 个 最 


优 算法 。 到 目前 为 止 ， 仍 然 没有 这 样 的 算法 。 当 然 ， 可 能 下 界 还 是 不 够 高 下面， 我们 将 得 
到 一 个 ?近似 算法 。 
图 9-34 的 例子 是 非常 可 取 的 ， 这 是 一 个 增加 两 个 环 的 对 换 。 理 想 地 ， 我 们 希望 在 任何 时 
刻 排序 中 都 有 这 种 循环 。 遗 憾 的 是 ， 并 不 总 是 这 样 的。 我 们 必须 处 理 其 他 的 情况 。 
LACE MEM DIR TMI ， aeaa 
n +1 的 数 ， 并 称 对 换 p(i，j，) 作 用 于 黑色 边 i， 1 2 3 4 5 ”6 
j 和 k。 图 9-35 是 为 黑色 的 边 分 配 数字 的 例子 。 | ee 
注意 ， 根 据 从 i 到 i 对 黑色 边 的 访问 ， 环 可 国 935 G0 的 时 色 边 被 标记 的 排列 
以 用 G, =, L) 来 表示 ， 其 中 是 环 中 最 右边 的 黑色 边 。 例 如 ， 图 9-36 所 示 的 G( 功 中 有 4 个 
交 赫 环 。 环 b 中 的 最 右 黑 色 边 是 黑色 边 6， 所 以 环 b 可 表示 为 《6，2，4)。 





有 两 种 不 同 的 环 ， 即 非 定 向 环 (non- eB, 
oriented cycle) 和 定向 环 (oriented cycle), *f ee ne 
FAA AAD 1 ’ an Ri, 9 ly, oo) i 是 递减 序列 了 a ra 1 € ™ d ~ ` N 


那么 环 C = (ii;，…，i) 是 非 定向 的 ; 否则 C 是 o4 has karaka’ G 

定向 的 。 图 9-37 是 非 定 向 和 定向 环 的 两 个 例子 。 pF 3 A S e 
如 果 Ac(p) = x， 我 们 称 对 换 p 为 x 迁移 (x- 图 9-36 C(7 包 含 4 个 循环 的 排列 

move), RRAC = (i;，…，i, ) 是 定向 环 ， 那 么 可 以 证 明 在 C 中 存在 i ,了 >，3 和 1 和 <， 
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UR... i, EB: r 产 生 包 含 顶点 元， A, 的 1 环 以 及 其 他 环 。 因 此 ，p 是 一 个 
2-move 对 换 。 总 之 ， 在 每 个 定向 环 中 有 一 个 2-move 对 换 ， 图 9-38 是 一 个 例子 ， 输 入 排列 为 0 
45 16327。 如 图 9-38a 所 示 ， 有 三 个 循环 , 循环 (6, 1,3, 4) 是 定向 环 。 如 图 9-38a 所 示 ， 
有 对 换 p = (i,， is, = p (1，3，6)。 这 个 对 换 对 应 将 子 串 (45) 和 (1 6 3) 交换 。 在 使 用 
这 个 对 换 之 后 ， 排 列 变 为 0 16 3 4 527， 并 有 5 个 环 。 如 图 9-38b， 环 的 个 数 增加 了 2 个 。 





a) 非 定向 环 (5，3，1) b) 定向 环 (6，2，4) 
图 9-37 定向 和 非 定向 环 


-rr eee ft tee 


K rae 





oe F440 15 ed) eG 13 7 


1 2 3 4 5 6 7 
i iz iy i 
l L _| 





a) HEFIO 4516327, t=3, EMME, 1, 3, MARXE, i i) 


ee re 


ON E E 2 7 
b) 对 换 之 后 的 环 图 


图 9-38 人 允许 2-move 的 定向 环 


考虑 图 9-39a， 图 中 没有 定向 环 。 容 易 看 出 ， 必 定 存在 多 于 一 个 的 非 定向 环 。 假 设 环 C = 
G,, 5, =, i) BAEZ AM, SEKH, i- IPRA PRATERIE Wr, atta, ,的 位 
置 为 ;。 可 以 证 明 s>ii， 且 对 换 p = (r +1, s, i)f—*0-move, BHR IA —T2-moveF#4F 
定向 环 C 转 换 为 定向 环 C'。 因 此 ， 在 非 定向 环 的 2-move 之 后 有 一 个 0-move。 图 9-39 所 示 是 一 


个 例子 。 





a) 排列 04 5 3 1 26， 非 定向 环 C=(ii, h), r=5, 5 =6, 
HepB, 6, D, m51, m- 二 3 以 及 而 ,= 4 


图 9-39 允许 0-move，2-move 的 非 定向 环 
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b) 对 换 之 后 的 坏 图 
图 9-39 (4%) 
从 前 面 的 讨论 中 看 到 任意 排列 x 在 2-move 置 换 之 后 有 一 个 2-move 置 换 或 者 0-move 置 换 。 
由 此 ， 可 以 得 到 对 换 距离 的 上 界 。 对 干 对 换 排 序 有 dD L nyie). 因此 ， 有 
一 个 可 以 产生 不 大 于 n+1-c(m 的 对 换 距 离 的 算法 。 
由 于 下 界 d(x)> PEAD AR LF) <n eC), 所 以 ， 有 性 能 比 为 2 的 对 换 排序 
近似 算法 ， 如 算法 9-8 所 示 。 
算法 9-8 ”求解 对 换 排序 问题 近似 解 的 2 近似 算法 





输入 :两 个 排列 xz 和 o。 
输出 ， 两 个 排列 x 和 o 之 间 的 最 小 距离 。 
步骤 1. 对 十 排序 排列 x， 重 新 标记 两 个 排列 为 一 致 排列 。 
PR. 构造 排列 z 的 环 图 G( 区 ， 仿 距离 dD = 0, 
步骤 3. While 有 定向 环 

执行 一 个 2-move,，d(z) = d(x) +1 

While 有 非 定向 环 

在 2-move 之 后 执行 一 个 0-move，d(z) = d(x) +2 

步骤 4. 输出 距离 d(m。 


一 个 2 近似 算法 的 例子 如 图 9-40 所 示 。 算 法 执行 如 下 : 

(1) 由 于 有 一 个 定向 环 06，1，3，4) ， 执 行 对 换 p(6，3，1)， 结 果 如 图 9-40c 所 示 。 

(2) 如 图 9-40b 所 示 ， 在 环 图 中 不 存在 定向 环 ， 存 在 两 个 非 定向 环 (6，2) 以 及 (7，3)。 在 对 
换 p(6，5，2) 之 后 执行 对 换 p(7，3，2)。 对 换 p(7 ，3，2) 的 结果 如 图 9-40d 所 示 ， 对 换 p(6，5， 
2) 的 执行 结果 如 图 9-40e 所 示 。 
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b) 定向 环 (6, 1, 3, 4) 的 对 换 p(6，3，1) 
图 9-40 2 近似 算法 的 例子 
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d) 9) 之 后 的 环 图 ， 定 向 环 (6，2，5) ， 其 他 坏 (1), (3), 
(4) 和 (7)， 以 及 定向 环 进行 的 对 换 2(6，5，2) 





ee ee ee ee 
e) 二 次 对 换 2-move、0-move 和 2-move 之 后 的 最 终 环 图 ， 
图 9-40 (#8) 
应 用 对 换 的 整个 过 程 如 下 所 示 : 
04516327 
01634527 
01345267 
01234567 


9.9 多 项 式 时 间 近 似 方案 


每 一 个 近似 算法 都 包含 误差 ， 我 们 当然 希望 误差 越 小 越 好 。 也 就 是 说 ， 我 们 希望 有 一 族 
近似 算法 ， 使 得 每 一 个 误差 有 一 个 相应 的 可 以 得 到 该 误差 的 近似 算法 。 因 此 ， 不 管 特定 的 误 
差 有 多 小 ， 都 可 以 通过 相应 的 近似 算法 得 到 这 个 误差 。 当 然 ， 由 于 小 误差 算法 的 时 间 复 杂 度 
必定 大 于 大 误差 算法 的 时 间 复 杂 度 ， 所 以 要 对 小 的 误差 付出 代价 。 不 论 误差 多 么 小 ， 时 间 复 
杂 度 都 是 多 项 式 级 ， 是 一 种 理想 情况 。 上 面 的 讨论 产生 了 多 项 式 时 间 近 似 方 案 (polynomial 
time approximation scheme, PTAS) 的 概念 。 

令 5or7 为 最 优 解 的 代价 ，54px 为 近似 解 的 代价 。 定 义 误 差 率 为 

E = Soer Sarx /9opr 


一 个 问题 的 PTAS 表 示 为 一 个 近似 算法 族 ， 使 得 每 个 指定 的 误差 率 E 有 一 个 具有 多 项 式 时 
间 复 杂 度 的 近似 算法 。 例 如 ， 假 设 算法 的 时 间 复 杂 度 为 O(n/E)。 那 么 不 论 E 多 小 ， 都 有 一 个 相 
对 于 E 的 多 项 式 时 间 近 似 算法 ， 因 为 E 是 常量 。 
平面 图 上 最 大 独立 集 问 题 的 PTAS 

在 本 节 将 介绍 平面 图 上 的 最 大 独立 集 问 题 ， 有 一 类 PTAS， 其 中 每 个 算法 的 时 间 复 杂 度 是 
O(8'kn), Herp k= [1 E]-1, 
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首先 定义 平面 图 (planar graph)。 称 图 为 平面 9$ 上 的 ， 如 果 它 画 在 93 上， 它 的 边 只 相交 在 
端点 上 。 一 个 图 是 平面 图 ， 如 果 它 画 在 一 个 平 


3 
面 上 。 图 9-41a 是 -个 平面 图 ， 图 9-41b 不 是 平 l 
面 图 。 2 4 
平面 图 上 的 最 大 独立 集 问题 是 NP 难 的 。 因 5 2 
此 ， 需 要 近似 算法 。 首 先 定义 一 些 术 语 。 面 ， 
(face) 是 一 个 区 域 ， 由 媒人 的 平面 定义 。 没有 ES 
4 3 


边界 的 面 称 为 外 部 面 (exterrior face) ， 其 他 面 
称 为 内 部 面 (interior face)。 例 如 ， 对 于 图 a -A PRR b) PARP fi 
9-42 中 的 面 ， 面 6 一 7 一 11 一 12 一 6 是 一 个 内 部 图 9-41 图 
面 ， 而 面 1 一 2 一 3 一 4 一 5 一 1 是 一 个 外 部 面 。 在 平面 图 中 ， 可 以 对 每 一 个 结 点 分 配 一 个 层次 。 
在 图 9-42 中 ， 仅 有 一 个 外 部 面 1 一 2 一 3 一 4 一 5 一 1。 因 此 ， 结 点 1，2，3，4 和 5 是 层 1。 随 后 ， 
结 点 6，7，11，12，8，9，10，13，14 是 层 2， 结 点 1$3，16，17 是 层 3。 结 点 的 层 可 在 线性 时 
间 内 计算 出 来 。 

如 果 一 个 图 没有 大 于 的 结 点 ， 那 么 称 该 图 为 k 外 平面 图 (k-outerplanar)。 例 如 ， 图 9-43 
包含 一 个 2 外 平面 图 。 








图 9-42 FARRA 图 9-43 2 外 平面 图 的 例子 


对 于 k 外 平面 图 ， 最 大 独立 集 问题 的 最 优 解 可 以 通过 动态 规划 方法 ， 在 时 间 0(8*) 中 找到 ， 
其 中 "是 顶点 的 个 数 ， 在 这 里 并 不 给 出 动态 规划 方法 的 细节 。 

已 知 任意 平面 图 G， 可 以 将 它 分 解 为 k 外 平 表 9-1 结 点 的 分 组 
面 图 的 集合 。 参 见 图 9-44， 置 上 为 2。 然 后 将 层 


3、6 和 9 中 的 所 有 结 点 组 成 类 3， 将 层 1、4 和 7 E tas Go 
中 的 结 点 组 成 类 1， 层 2、5 和 8 中 的 结 点 组 成 类 。 K 3 69 (%3) 


2， 如 表 9-1 所 示 。 

如 果 删 除 类 3 中 的 所 有 结 点 ， 即 层 3 ，6 和 9 中 的 结 点 ， 那 么 得 到 的 结果 如 图 9-45 所 示 。 显 
然 图 9-45 中 的 所 有 子 图 都 是 2 外 平面 图 。 每 一 个 2 外 平面 图 可 以 在 线性 时 间 内 找到 其 最 大 独立 
集 。 此 外 ， 对 于 原始 平面 图 来 讲 ， 这 些 最 大 独立 集 的 并 仍然 是 一 个 独立 集 (不 必 是 最 大 的 ) ， 
因此 可 以 作为 一 个 近似 解 。 

类 似 地 ， 可 以 删除 类 1 中 的 结 点 ， 即 层 1，4 和 7 中 的 点 ,结果 图 中 仍然 由 2 外 平面 图 集 组 成 。 
采用 相似 的 方法 可 以 得 到 最 初 平面 图 的 近似 最 大 独立 集 。 

现在 ， 类 1 中 结 点 的 层 都 是 同 余 为 1 的 (mod k +1)， 类 2 中 的 结 点 的 层 都 是 同 余 为 2 的 
(modk+1)。 基 于 某 个 指定 的 :， 近 似 算 法 运行 如 下 : 
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算法 9-9 在 平面 图 上 求解 最 大 独立 集 问题 的 近似 算法 
步骤 1. For 所 有 的 1 = 0，1，…，k，do 


(1.1) OG, 为 通过 删除 问 余 为 Kmoed k + 的 层 上 的 所 有 结 点 得 到 的 鲜 ， 剩 余 的 子 图 均 是 4 外 正面 图 。 
(1.2) 对 十 组 个 k 外 平面 图 ， 找 出 它 的 最 大 独立 集 。 令 5; 为 这 些 解 的 于 集 。 
步骤 2. 在 So， S, Ty SP, 选择 最 大 规模 的 5, ， JE E aE IS aps o 


C 


图 9-44 9 层 的 平面 图 图 9-45 删除 3，6 和 9 层 上 的 结 点 得 到 的 图 
上 面 近似 算法 的 时 间 复 杂 度 显然 是 0(8* kn)。 下 面 将 介绍 与 误差 率 成 反比 。 因 此 ,平面 图 
|- 的 最 大 独立 集 问题 有 一 个 PTAS。 
注意 , 已 将 所 有 的 结 点 分 为 (K+1) 个 类 ， 每 一 类 对 应 一 个 同 余 为 {mod 上 +1) 的 层 , i=0， 
1，…, 上 。 每 个 独立 集 5 的 结 点 个 数 的 平均 数 是 1SV(k +1)， 其 中 18I 是 这 个 独立 集中 结 点 的 个 数 。 


Hi, EDA -个 r 使 得 在 orr 中 至 多 有 二 -个 结 结 点 同 余 为 rmod 上 +1)。 这 意味 着 通过 从 Sorr 


ss 


中 删除 类 r 中 的 结 点 得 到 解 9, ， 





1 
or +1 个 结 点 ， 该 解 至 少 有 lor- 二 


+1) 


k 
= so 到 个 结 点 。 因此 ， 


k 
k 
Is, > Suma 
根据 算法 ， 有 
k 
Sapxl 2 |s, > Sorig 
或 
Bor -Sa 1 
[Soml k 
因此 ， 如 果 置 上 = [1/E1-1， 那 么 上 面 的 公式 为 
ec- <E 
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这 表明 每 个 已 知 的 误差 界限 E 都 有 相对 的 x 保证 近似 解 在 误差 率 范围 内 不 同 于 最 优 解 。 此 
外 ,无 论 误 差 多 么 小 ， 都 可 以 在 0(8 kn) 时 间 复 杂 度 内 找到 达到 该 误差 的 算法 ， 该 算法 相对 于 
n 来 说 是 多 项 式 的 。 | 
0/1 背 包 问 题 的 PTAS 

011 背 包 问题 是 一 个 NP 难 问题 ， 在 第 5 章 中 讨论 过 。 实 在 令 人 惊奇 的 是 对 于 该 问题 存在 多 
项 式 时 间 的 近似 方案 。 

0/1 背 包 问 题 定义 如 下 :已 知 # 个 物品 ， 第 i 个 物品 有 利润 p; 以 及 重量 w; 。 已 知 一 个 整数 M， 
0/1 背 包 问 题 是 挑选 这 "个 物品 的 子 集 , 使 得 在 总 重量 不 超过 M 的 约束 下 , 取得 的 利润 总 和 最 大 。 
在 形式 上 ， 和 希望 使 26 忆 最 大 ， 其 中 5 = 1 或 0， 约 束 为 26w; <M, 

看 一 个 例子 。M = 92，n = 8， 利 润 和 重量 如 表 9-2 所 示 ， 物 品 的 顺序 是 根据 p;/w; 的 非 递增 
次 序 确定 的 。 


表 9-2 8 个 物品 的 利润 和 重量 





i 1 2 3 4 5 6 7 8 
p, 90 61 50 33 29 23 15 13 
w, 33 30 25 17 15 12 10 9 
p,lw, 2.72 2.03 2.0 1.94 1.93 1.91 1.5 1.44 


基本 上 ， 近 似 算法 建立 在 误差 率 。 上 。 一 旦 给 定 e， 通 过 精心 地 计算 ， 计 算 一 个 国 值 ， 称 
为 7T。 由 这 个 阀 值 Z， 将 所 有 7 个 物品 分 成 两 个 子 集 : BIG 和 SMALL。BIG 包 含 所 有 利润 大 于 7T 的 
项 ，SAMA4LL 包 含 所 有 利润 小 于 等 于 7 的 项 。 

在 这 个 例子 中 ，7 为 46.8。 因 此 ,BIG = {1, 2, 3}, SMALL={4, 5, 6, 7, 8}. 

在 得 到 B1G 与 MALL 之 后 ， 将 81G 中 物品 的 利润 标准 化 。 这 个 例子 中 ， 标 准 化 利润 是 

pr'=9 

py =6 

及 p; =5。 

现在 尽量 枚 举 出 这 个 问题 实例 的 所 有 可 能 解 ， 有 很 多 这 样 的 解 。 我 们 考虑 其 中 的 两 个 : 

解 1， 挑选 物品 ! 和 2。 标 准 化 利润 的 总 和 为 15， 相 应 原始 利润 的 总 和 是 90 + 61 = 151， 重 
量 总 和 为 63。 : 

解 2: 挑选 物品 1、2 和 3。 标 准 化 利润 总 和 为 20， 相应 原始 利润 的 总 和 是 90 + 61 + 50 = 
01， 重 量 总 和 为 88。 

由 于 重量 总 和 小 于 M = 92， 我 们 可 以 从 SMALL 中 向 两 个 解 中 添加 某 些 物品 。 这 可 以 由 贪 
心 方法 得 到 。 

解 1， 对 于 解 1!， 可 添加 物品 4 和 6， 利 润 总 和 为 151+33+23 = 207, 

解 2， 对 于 解 2， 并 不 能 从 SMA4LL 中 添加 任何 物品 ， 因 此 利润 总 和 为 201。 

当然 还 有 很 多 这 样 的 解 。 每 个 解 都 可 以 用 贪心 算法 得 到 一 个 近似 解 。 可 以 证 明 解 1 是 最 大 
的 。 因 此 ， 输 出 解 1 作 为 近似 解 。 近 似 算法 必须 是 一 个 多 项 式 算法 ， 这 一 点 很 重要 。 贪 心 法 部 
分 明显 是 多 项 式 的 。 算 法 关键 的 部 分 是 在 BIG 中 为 物品 找到 可 行 解 的 部 分 。 这 些 可 行 解 之 一 是 
0/1 背 包 问 题 的 一 个 最 优 解 。 如 果 算 法 的 这 部 分 是 多 项 式 的 ， 是 否 意 味 着 可 以 用 多 项 式 算 法 来 
解决 0/1 背包 问题 呢 ? 

后 面 将 证 明 ， 这 部 分 实际 上 解决 了 一 个 特定 的 0/1 背 包 问 题 。 随 后 将 介绍 在 该 问题 的 实例 
中 ， 利 润 被 标准 化 在 标准 化 利润 之 和 小 于 (6/8 | REA, 上 是 误差 率 。 也 就 是 说 ， 标 准 化 
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利润 总 和 小 于 一 个 常数 。 只 要 满足 这 个 条 件 ， 就 有 一 个 多 项 式 时 间 算 法 ， 产 生 所 有 可 能 的 可 
行 解 。 因 此 ， 这 里 的 近似 算法 是 多 项 式 的 。 

在 给 出 了 这 个 近似 算法 上 层 的 概述 后 ， 现 在 给 出 该 算法 的 细节 。 再 次 应 用 上 述 数 据 来 描 
述 算法 。 令 e 为 0.6。 

PR. 根据 利润 与 重量 比率 p;/w; ， 将 物品 非 递增 排序 ( 表 9-3) 


表 9-3 排序 物品 


i i 2 3 4 5 6 7 8 
P 90 6l 50 33 29 23 15 13 
w 33 30 25 17 15 12 10 9 
Pil Ww; 2.72 2.03 2.0 1.94 1.93 1.91 1.5 1.44 


步骤 2: 计算 数 O 如 下 : 
找到 最 大 的 4， 使 得 
W=wtw t +w,<M 
如 果 d=n 或 W=M, BZ 
BP apy = Py t+ Pot °° + Pg RINDICES = {1, 2 
停止 。 
在 这 个 例子 中 ， Popr = Papx 
CM, EQ = pi + pz +… + Pet Dan 
在 本 例 中 ，d=3，@=90+61+50+33=234。 
Q 的 特性 是 什么 ?现在 证 明 


QI2< Porr <Q 


注意 ，P + proto + Pa < Porr 
由 于 W,, SW, PA, Par PETA THR. 


Pasi Popr 
PARLA, Q = py t Pot # Py t+ Pani S2Popre 
或 者 Q/2<Popr 
由 于 Popr 是 一 个 可 行 解 ， MORE, ALLS EP opr <Q. 
因此 , Q2<Por <O ` 
后 面 将 看 到 这 对 于 误差 分 析 是 关键 。 
PRS. 计算 标准 化 因子 6: 
6 = O(e/3) 
在 本 例 中 ，6 = 234(0.6/3)? = 234(0.2) = 9.36 
那么 计算 参数 g: 
8=|2/5|= |678) | = |(3/0.6)° | =25 
WT = Q(e/3), 
在 这 个 例子 中 ，T = 234(0.6/3) = 46.8, 


~ 


步骤 4: 
步骤 4.1: 令 SMALL 合 并 所 有 利润 小 于 等 于 T 的 物品 ， 其 他 的 物品 放 入 BIG。 
EAP, SMALL = {4, 5, 6, 7, 8} 
BIG= {1, 2, 3} 
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步骤 4.2: 对 于 BIG 中 的 所 有 物品 ， 根 据 下 面 的 公式 标准 化 其 利润 : P= [P16]。 
TEA PHA, P’ = |90/9.36] =9 


P; = |61/9.36| =6 


| P! = |50/9.36| =5 | 
步骤 4.3: 用 规模 8 初始 化 数组 4。 数 组 的 每 一 个 元 素 对 应 于 Pr" 的 一 个 组 合 。 每 个 元 素 4 
包含 三 个 字段 [I、P 和 W， 分 别 代表 组 合 的 下 标 值 、 利 润 的 总 和 以 及 重量 的 总 和 。 
步骤 4.4: 对 于 BIG 中 的 每 个 物品 i， 扫 描 这 个 表 ， 对 每 一 个 数组 元 素 执 行 下 面 的 操作 :对 
于 元 素 A[ 四 ， 如 果 A 四 中 总 是 非 空 ， 添 加 物品 ;将 不 会 使 重量 总 和 超过 限制 M， 
那么 检查 相应 的 AU +pi"] 的 重量 ， 该 重量 与 添加 ;到 A 四 的 组 合 相 对 应 。 如 果 AL 
+p1] 为 空 ， 或 者 AL +p]: W 的 重量 大 于 A 四 W +w (是 添加 到 A 思 中 的 i 相对 应 
HEE), WAHAU - IU 人 {更 新 这 个 数组 元 素 ， 并 且 更 新 对 应 的 利润 和 重量 。 
本 例 运 行 如 下 。 
当 i= 1，pi' = 9， 如 表 9-4 所 示 。 


表 9-4 i=1, p' = 9 的 数组 A 





i=2, p2'=6, 如 表 9-5 所 示 。 
表 9-5 i=2, p,' = 6 的 数组 A 





EP 


o uyga UNF WN OC] 
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i= 3% pis, 如 表 9-6 所 示 。 


表 9-6 i=3, p,' = 5 的 数组 A 











查看 表 9-6。 每 个 非 空 数组 元 素 表示 一 个 可 行 解 。 例 如 ， AU] = 5 对 应 仅 为 一 件 物品 的 选项 ， 
如 物品 3。 其 标准 化 利润 的 总 和 为 5， 利 润 总 和 为 50， 重 量 总 和 为 25。 对 于 j = 25， 选 择 物品 1 
和 2。 在 这 种 情况 下 ， 其 标准 化 利润 为 15 ， 利 润 总 和 为 1531， 重 量 总 和 为 63。 

步骤 5: 对 于 数组 4 的 每 个 元 素 ， 用 贪心 算法 将 SMALL 中 的 物品 添加 到 对 应 的 组 合 中 。 


表 9-7 最 终 的 数组 A 





o whob 一 | 


再 次 查看 表 9-7 的 含义 。 对 于 j = 15， 可 以 添加 物品 4 和 6， 得 到 利润 总 和 为 207。 对 于 j = 20， 

从 BIG 中 可 选择 物品 !，2 和 3。 在 这 种 情况 下 ， 由 于 将 超过 重量 约束 ， 所 以 不 会 从 SMALL 中 添 
加 任何 物品 。 因 此 ， 重 量 总 和 为 201。 

步骤 6: 选择 步 又 5 中 最 大 的 利润 为 近似 解 。 本 例 中 ， 选 定 ZP” = 15 对 应 的 数组 元 素 ， 其 
产生 的 最 大 总 利润 为 207。 

读者 也 许 观 察 到 ， 步 骤 4.4 是 一 个 穷 举 扫描 步骤 ， 这 些 物品 的 标准 化 利润 为 9，6 和 5， 对 

应 重量 分 别 为 33，30 和 25。 从 利润 为 9 的 物品 开始 ， 由 于 其 重量 小 于 M， 可 以 只 挑选 这 一 个 ， 

其 总 重量 为 33， 总 标准 化 利润 为 x”， 然 后 扫描 标准 化 利润 为 6 的 物品 。 只 挑选 这 一 物品 。 如 果 
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这 样 挑选 ， 其 总 标准 化 利润 为 6， 总 重量 为 30。 如 果 挑 选 已 经 扫描 过 的 两 个 物品 ， 那 么 总 的 标 
准 化 利润 为 9 + 6 = 15， 总 的 重量 是 33 + 30 = 63。 因 此 ， 有 下 面 4 个 可 行 解 : 

(1) 不 选任 何 一 个 。 

(2) 只 选 物品 1， 总 的 标准 化 利润 为 9， 总 重量 为 33。 

(3) 只 选 物品 2， 总 的 标准 化 利润 为 6， 总 重量 为 30。 

(4) 挑选 两 个 物品 1 和 2， 总 的 标准 化 利润 为 15， 总 重量 为 63。 

直觉 上 ， 这 一 步 花 费 的 时 间 是 指数 级 的 : 28“。 这 就 出 现 了 一 个 关键 的 问题 : 为 什么 这 一 
步 是 多 项 式 的 ? 

下 面 ， 将 证 明 数 组 4 的 大 小 不 会 大 于 8。 

令 数组 4 的 最 大 元 素 有 标准 化 利润 p，+ Pi。+ … + Di。 由 于 这 对 应 可 行 解 ， 所 以 有 Pu + Pi, 
tot Dy <Popy SQ, Pi; = |P; /5 o 

BPa + pi,’ + … + pi'。 


上 t t 
Pi + Pa t+ i 


= |P; (0|+|p,/5]+--+|p,/6| 

< (i +P, ++p) | 

<|2/5| 

=8 

这 就 是 为 什么 大 小 为 的 数组 是 足够 的 。g 是 一 个 常数 ， 与 4 无 关 。 扫 描 代价 时 间 至 多 为 ng， 
这 就 是 为 什么 步骤 4 是 多 项 式 的 。 

近似 算法 的 时 间 复 杂 度 如 下 : 

HR: O(n log n) 

#2: O(n) 

步骤 4.1 到 4.2，O(m) 

步骤 4.3: Olg) 

BRAA, O(ng) 

BRS, O(ng) 

BRE, O(n) 

近似 算法 总 的 时 间 复 杂 度 是 

O(n log n)+O(n)+O(n)+0(g)+O(ng)+O(ng)+O(n) = O(n log n)+O(ng) 

= O(n log n)+O(n(3/e)’) 

因此 ， 这 个 算法 是 一 个 多 项 式 时 间 近 似 方 案 ， 其 时 间 复 杂 度 是 s 的 函数 。 我 们 所 设置 的 误 
差 率 越 小 ， 时 间 复 杂 度 就 变 得 越 大 ， 但 是 它 仍然 是 多 项 式 的 。 

现在 对 该 近似 算法 作 误 差分 析 。 首 先 ， 需 要 介绍 一 些 断 言 。 

断言 1: 对 于 ViEBIG, pi 之 3/e 

已 知 p,' = | p;/6| = | P,/O(e/3)° | 

但 是 ViEBIG , p; >Q(e/3) 

PRU, p' = 3/e. 

断言 2， 对 于 VIEBIG, p;'d<p;<p;'(1 + £3). 
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注意 p= |p] 

FREA, p;'<p,/6 

因此 ， 有 p56<pi。 

此 外 ， 根 据 断 言 1 的 p;' 宇 3/e， 还 有 pi/6<pi'+1=pi(l+ Upp + E). 

断言 3: SPor 为 0/1 背 包 问 题 的 一 个 最 优 利润 ，P6www, 为 对 同一 问题 采用 贪心 法 计算 得 到 
的 利润 。 那 么 

Popr~P Greedy < max{p;}。 

证 阴 ， 令 5 为 贪心 算法 没有 选择 的 第 一 个 物品 。 根 据 贪心 算法 的 选择 ， 

P Greedy tpp 2 Popr 
这 样 ，Popy SPoreay + PpS Poren + Max{p;} 
所 以 ， Popr —P greedy <max{p;}, 
现在 讨论 近似 算法 的 误差 分 析 。 
EE, Porr 可 以 表示 如 下 : 

Popr = Pi, + Pip tu +p +a 
其 中 pi ，p;,，…，Pi, 是 BIG 中 的 物 蝇 ，a 是 SMALL 中 的 物品 对 应 的 利润 总 和 。 

Rci» a ci 的 对 应 重量 为 p; ， Pigs “+ Pigo 考虑 Pi 二 PP to + pi 由 于 pi + pi to 
+p, EMEA, TRE PPE BML, jo oe Ja BEP + pa toe + Di! =p + 
Pi to + Pi,'s 以 及 cj tot Cj, SCi + + Cio 也 就 是 说 ， 近 似 算法 选择 物品 ji ，j,，…，j， 
KARA Igy ty tho ` 

算法 在 执行 到 步 难 6 期 间 得 到 总 和 Py = p, +7,+ +p, + Bo 

显然 ,根据 Pipx 的 选择 ， 

Papx > Piro 

因此 ， 

Popr ~Papx SPopr—Pu 

根据 断言 2， 有 

p'O<p;<p;'O(1 + €/3) 

WET AB AAP opr = Di, +p t'e + Dit a 和 P= Pj, + Pip + + Pi, + Bs 可 以 看 到 

(Pa't Pa' to + Pi’ )6 + a< Porr <(p;,' + pi,’ + + pi, J + €/3) + a 

以 及 人 + + +p 6+ BSPy<(@,,'+ + + pj,’ OC + €/3) + B 

Fp +p tte +p =P t+ +P, > TAGE 

Porr S(p;, + Pi,’ + + Pi, YOU + €/3) +. 

以 及 Pi 之 (pi 十 Pi 十 + Di,’ )6 + B 

因此 ， 有 

(Porr ~Pa) Porr S(p," + © + pi' )6(e/3) + a—p) Porr 
< €/3 + (a—P)/Popr (9-3) 

必须 进一步 证 明 

la—-Bl< Q(e/3) 

这 可 推导 如 下 : 

a 是 在 容量 为 M- (c + cu + …+ c, ) 的 SMAEZL 中 定义 的 物品 的 0/1 背 包 问 题 中 利润 的 总 和 。 

1 是 在 容量 为 M_ (c + cy + … + 6) 的 SMALL 中 定义 的 物品 的 0/1 背 包 问题 由 贪心 算法 得 到 
的 利润 总 和 。 令 PB' 为 在 容量 为 M- (cl + ci, + … + ci,) 的 SMALL 中 定义 的 物品 的 0/1 背 包间 题 由 
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RD BIE EY AAD 

WR1: a>p 
由 于 假设 c; te, to $C; ZC; te, to +c, 
Mr-(c +), + +e) SMC +c, + + C) 
而 且 ，68 和 通过 贪心 法 在 SM47L 中 得 到 ，SAMA41Z 以 非 递 增 次 序 排序 。 因 此 ， 
M- (cte to te) SMC + c+ .+0;,) 隐 含 着 P'<p。 
所 以 ， 
a—ßp< a-f" 
根据 断言 3， 同 样 有 
a—ß'< max{P; liESMALL} 
由 于 5MALL 中 每 个 物品 的 利润 小 于 等 于 8(s/3) 的 性 质 ， 得 到 
a-B<Q(e/3) 
情况 2: a<p 
HP, + + py) + 有 Pr 和 Pomr 科 DT + Pi’ )d(1 + 6/3) + 0 
ALA, B-a<(p;,'+ + + pi,’ 6/3) 

K(p;, + + p, (E13) 

< Popr © £3 

<Q(e/3) 
考虑 情况 1 和 情况 2， 可 以 得 到 

la—Bl<Q(e/3) (9-4) 

将 式 (9-4) 代入 式 (9-3)， 得 到 
(Popr—Pn) < /3 + (2/3)Q/Porr 
根据 Q 的 选择 ， 
Porr > Q/I2 
ARKEP spy 2 Py， 得 到 (Po 一 Papx)/Popr <€/3 + 2E = E, 
上 面 的 等 式 表 明 这 个 近似 算法 是 一 个 多 项 式 时 间 近 似 方案 。 


9.10 最 小 路 径 代 价 生成 树 问题 的 2 近似 算法 


最 小 路 径 代价 生成 树 问题 (minimum routing cost spanning tree problem, MRCT) 类 似 于 
最 小 生成 树 问 题 。 在 最 小 生成 树 问题 中 ， 生 成 树 中 所 有 的 边 总 代价 是 最 小 的 。 在 最 小 路 径 代 
价 生成 树 问题 中 ， 我 们 感 兴趣 的 是 路 径 的 代价 。 对 于 树 中 任意 两 个 结 点 u 和 hv， 在 它们 之 间 有 
一条 路 径 ， 这 条 路 径 中 所 有 的 边 总 代价 称 为 这 对 结 点 的 路 径 代价 。 进 一 步 规 定 已 知 的 图 是 一 
个 完全 图 ， 且 所 有 的 边 代价 满足 三 角 不 等 式 。 因 此 ， 最 小 路 径 代价 生成 树 问题 定义 如 下 : 已 
知 完全 图 G， 其 边 的 代价 和 满足 三 角 不 等 式 , 最 小 路 径 代价 生成 树 问题 是 找到 G 的 一 棵 生成 树 ， 
该 生成 树 中 结 点 间 所 有 成 对 结 点 的 路 径 代价 总 和 最 小 。 

参见 图 9-46， 图 9-46a 中 的 完全 图 的 一 棵 最 小 路 径 代价 生成 树 如 图 9-46b 所 示 。 

令 RC(u，v) 表 示 树 中 结 点 u 和 v 之 间 的 路 径 代价 ， 该 树 中 所 有 成 对 结 点 的 路 径 代 价 的 总 和 
是 

RC(a, b)+ RC(a, c)+RC(a, d)+RC(b, c)+RC(b, d) + RC(c, d) 

=1+2+2+1+1+2 

=9 
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这 是 所 有 可 能 生成 树 中 最 小 的 。 
最 小 路 径 代价 生成 树 问 题 是 NP 难 的 。 在 本 


a b 
节 中 ， 将 给 出 该 问题 的 一 个 2 近似 算 法 。 在 下 ， 
. 节 中 ， 将 会 进一步 介绍 这 个 问题 的 PTAS。 y i ， 
在 介绍 算法 之 前 ， 首 先 指出 ， 我 们 将 每 对 7 
结 点 计数 两 次 。 也 就 是 说 ， 从 结 点 4 到 v 之 间 的 d N, 
IZL MAE vau Z ERR tE 
做 是 为 了 简化 讨论 。 4 ‘ É 
2 近似 算法 基于 称 为 质心 (centroid) 的 概 
:。 一 棵 树 的 质心 是 这 样 一 个 结 点 ， 该 结 点 的 
除 会 导致 每 “个子 图 将 包含 不 多 于 n/2 个 结 图 9-46 完全 图 的 最 小 路 答 代 价 生成 树 
点 ， 其 中 n 是 树 中 所 有 结 点 的 总 数 。 参 见 图 9-47， 结 点 m 是 一 个 质心 。 

芳 虑 树 T 中 的 任意 结 点 v,T 以 其 质心 m 为 根 。 
根据 定义 ，mm 的 每 一 棵 子 树 包含 不 多 于 n/? 个 结 
点 。 考 虑 7 中 包含 任意 结 点 v 的 子 树 必定 包含 不 
多 于 n/2 个 结 点 。 这 意味 着 ， 在 结 点 4 与 vy 之 间 至 be h 


a) b) 


è> 


a 


= 


a 








少 有 nn/2 条 通过 mm 的 路 径 。 例 如 ， 考 虑 图 9-47 中 f 
树 的 结 点 e。 只 有 e 与 {、h 和 i 之 间 的 路 径 没 有 通 
过 质心 m， 其 他 所 有 结 点 到 e 的 路 径 都 会 通过 m。 , 
因此 ， 在 这 樟树 的 路 径 代 价 中 ， 从 任意 结 点 v 
到 m 的 路 径 长 度 将 计数 至 少 2(n/2) = n 次 。 用 c 
RC(4，y) 表 示 结 点 & 和 v 之 间 路 径 的 代价 ， 树 图 9-47 树 的 质心 
C(D 的 代价 是 
CDEn > RC(u,m) 
2 (9-5) 
假设 树 7 是 一 棵 最 小 路 径 代价 生成 树 ，z 是 7 的 一 个 质心 ， 
那么 上 面 的 等 式 仍然 成 立 。 现 在 ， 用 m 来 得 到 近似 算法 。 如 图 
9-48 所 示 ， 定 义 1 星 树 (1-star) 是 只 有 一 个 内 部 结 点 ， 而 其 他 
结 点 都 是 叶子 结 点 的 树 。 
近似 算法 是 搜集 所 有 到 六 的 结 点 以 形成 1 星 树 8$， 该 树 同样 图 9.48 1 星 树 
是 一 棵 生成 树 。 令 w(v，m) 表 示 原 始 图 G 在 结 点 v 与 m 之 间 边 的 权 
值 。 这 棵 星 树 的 路 径 代 价 的 总 和 记 为 C(S)， 表 示 如 下 : 
C(S) =(2n- DS w(v,m) 
v (9-6) 
因为 三 角 不 等 式 ， 所 以 w(Y，m) 小 于 T 的 RC(Y，m)。 因 此 ， 可 以 得 到 
C(S) = any RC(v,m) 
a (9-7) 
这 就 是 
C(S)<2C(T) (9-8) 


因此 , 构造 的 1 星 树 5 是 一 个 最 小 路 径 代价 生成 树 问 题 的 2 近似 解 。 从 最 小 路 径 生 成 树 开始 ， 
但 是 并 没 得 到 任何 最 小 路 径 代 价 生成 树 。 如 果 这 样 做 ， 就 不 需要 这 个 问题 的 任何 近似 算法 了 。 
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在 没有 树 的 情况 下 ， 如 何 找 到 该 树 的 质心 m 呢 ?已 知 完全 图 G， 它 只 有 n 棵 ! 星 树 。 因 此 ， 
可 以 产生 一 个 穷 举 搜索 来 构造 所 有 可 能 的 n 棵 1 星 树 ， 将 具有 最 小 代价 的 那个 作为 近似 解 。 这 
棵 1 星 树 必须 满足 要 求 ， 近 似 算法 的 时 间 复 杂 度 是 O(n )。 

可 能 读者 会 注意 到 ， 我 们 仅 证 明了 满足 要 求 的 1 星 树 的 存在 。 穷 举 搜索 可 能 会 找到 一 棵 1 
星 树 ， 其 路 径 代价 小 于 上 面 讨论 的 代价 。 


9.11 最 小 路 径 代 价 生 成 树 问题 的 PTAS 


在 上 节 介 绍 了 对 于 最 小 路 径 代 价 生成 树 问题 
的 2 近似 算法 。 该 近似 算法 是 基于 这 样 的 思想 每 
个 图 G 存 在 一 棵 1 星 树 ， 其 路 径 代价 至 多 是 最 小 路 
径 代价 生成 树 路 径 代价 的 两 售 。 由 于 仅 有 n 棵 1 星 
树 ， 所 以 可 在 多 项 式 步 数 内 找到 近似 解 。 

在 本 节 将 介绍 最 小 路 径 生成 树 问题 的 PTAS。 
ALU, HELER, REK, Rew). 

一 棵 k 星 树 是 确 有 k 个 内 部 结 点 的 树 。 图 9-49 图 9-49 一 棵 3 星 树 
是 一 棵 3 星 树 。 

在 本 节 剩 余部 分 中 ， 令 mcks(G，D 表 示 图 G 的 最 小 路 径 代价 x 星 树 的 路 径 代 价 ，mrcsi(G) 表 
示 G 的 最 小 路 径 代价 生成 树 的 路 径 代价 。 将 证 明 : 


mceks(G,k) < (K+3\ mrcst(G) 





\k+1) (9-9) 
当 k= 1 时 ， 构 造 一 棵 1 星 树 ， 上 面 的 公式 变 为 : 
mcks(G, 1)<2mrcst(G) (9-10) 


这 在 上 一 节 已 证 明 。 
等 式 (9-9) 表示 用 k 星 树 近 似 最 优 解 的 误差 率 为 
2 
“kel (9-11) 
对 于 上 = 2， 误 差 率 为 0.66;, k= 5， 误 差 率 减 小 到 0.33。 给 定 一 个 误差 界 ， 用 下 面 的 等 式 挑 


Sek: 
laa (9-12) 


因此 ， 较 大 的 上 意味 着 较 小 的 误差 率 。 对 于 给 定 的 误差 界限 ， 可 以 选 出 相应 足够 大 的 k 以 
保证 由 k 星 树 导 出 的 误差 不 超过 指定 的 误差 界限 。 可 以 证 明 ， 找 到 一 个 给 定 完全 图 的 最 小 路 径 
代价 £ 星 树 的 时 间 复 杂 度 为 O(n* )。 对 于 每 个 :， 不 管 它 多 大 ， 近 似 算法 的 时 间 复 杂 度 仍然 是 多 
项 式 的 。 也 就 是 ， 对 于 最 小 代价 生成 树 问题 有 PTAS。 

为 了 找 出 最 小 路 径 代价 k 星 树 , 需 要 一 个 称 为 6 分 离 (5-separator) 的 概念 ， 其 中 0<6<1/2。 
已 知 图 G，G 的 6 分 离 是 G 的 一 个 最 小 子 图 ， 删 除 它 将 产生 每 个 包含 不 多 于 6n 个 结 点 的 子 图。 对 
于 6 = 1/2，6 分 离 仅 包含 一 个 结 点 ， 即 质心 (centriod)， 将 在 最 后 一 节 介 绍 。 可 以 证 明 ， 在 6 
与 K 之 间 有 如 下 关系 式 : 


k+3 (9-13) 
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或 者 ， 反之 ， 
2 
的 (9-14) 
用 式 (9-14) 代 替 式 (9-9)， 得 
人 上 
mceks(G,k) < (ig) (9-15) 


从 本 质 上 讲 ， 推 理 过 程 如 下 : 如 果 有 误差 率 界限 已 ， 可 以 根据 等 式 (9-12) 挑选 k， 然 后 
通过 等 式 (9-13) 确定 6。 经 过 56 分离 ， 可 以 确定 满足 误差 界限 要 求 的 k 星 树 。 假 设 指 定 E 为 0.4。 
那么 ， 用 等 式 (9-12) 选 出 k= (2/0.4) 一 1 = 4， 找 出 6= 2/(4 + 3) = 2/7 = 0.28, 

接 下 来 先 讨 论 上 = 3 的 情况 来 说 明 PTAS 的 基本 概念 。 在 这 种 情况 下 ， 通 过 等 式 (9-13) 得 
到 6 = 2/(3 + 3) = 1/3, 

假设 已 经 找到 最 小 路 径 代价 生成 树 T7。 不 失 一 般 性 ， 假 设 T 的 根 为 其 质心 m， 那 么 至 多 有 
两 棵 包含 多 于 n/3 个 结 点 的 子 树 。 令 结 点 a 和 5 是 具有 至 少 n/3 个 结 点 的 最 低层 结 点 ， 忽 略 m = a 
Bom = b 的 特殊 情况 。 这 两 种 特殊 情况 的 处 理 相 同 ， 产 生 的 结果 也 相同 。 令 P 表 示 T 中 从 点 a 到 
点 b 的 路 径 ， 因 为 没有 质心 m 的 子 树 含有 多 于 /2 个 结 点 ， 所 以 这 条 路 径 必须 包含 质心 m。 根 据 
定义 ，P 是 (1/3) 分 离 。 接 下 来 ， 证 明基 于 P， 如 何 构 造 最 小 路 径 代价 3 星 树 。3 星 树 路 径 代价 不 
会 多 于 7 的 路 径 代 价 


Bt, PAE ARI AV. Voo Vms Vom 和 Vs, o HAV. Ve 和 V, 分 别 由 在 P 中 的 最 低 
祖先 分 别 为 4、b 和 mm 的 结 点 组 成 ， 和 集合 Vos (Vom ) 分 别 与 在 P 中 最 低 祖 先 分 别 为 4 和 mm 之 间 (在 5 
和 m 之 间 ) 的 结 点 组 成 。 

然后 将 P 用 具有 边 (a，m) 和 (5，m) 的 路 径 代 赫 。 将 V, ，V, 和 V, 中 的 每 个 结 点 v， 分别 
与 4a、b 和 m 连 接 。V, (Vom ) 中 的 所 有 结 点 都 连接 到 a(b)， 或 者 都 连接 到 m。 因 此 ， 有 4 棵 3 
星 树 ， 下 面 证 明 其 中 之 一 是 满足 要 求 的 。 一 个 典型 的 情况 如 图 9-50 所 示 ， 显 示 了 所 有 的 4 
棵 3 星 树 。 

现在 尽量 找 出 最 小 路 径 代 价 生成 树 路 径 代 价 的 公式 。 该 树 上 的 每 个 结 点 v 有 一 个 从 v 到 P 中 
结 点 的 路 径 。 令 v 到 P 中 结 点 的 路 径 长 度 记 为 dr(v，P)。 由 于 P 是 一 个 (1/3) 分 离 ， 所 以 在 总 的 路 
径 代 价 中 ， 路 径 长 度 必 定 至 少 计数 n/3 次 。 对 于 P 中 的 每 一 条 边 ， 由 于 在 边 的 某 侧 至 少 有 n/3 个 
结 点 ， 所 以 在 路 径 代价 中 边 至 少 计数 (n/3X2n/3) 次 。 令 w(P) 为 P 的 总 路 径 长 度 ， 那 么 有 

mrest(G)< (2n/ > dt(v, P) +(2/9)n?w(P) 
7 (9-16) 





图 9-50 树 及 其 4 棵 3 星 树 
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现在 ， 分 析 构 造 的 3 星 树 的 路 径 代 价 。 

(1) 对 于 最 终 的 路 径 代价 中 的 每 条 边 (v, a)、 
(Vb) 以 及 (Vv，m) 计 数 (n 一 1) 次 。 对 于 V。 VV, 
UV,, 中 的 每 个 结 点 v， 唯 一 要 说 的 是 边 的 权 值 
不 大 于 dt(v，P)。 

(D) 对 于 Vo Vim 中 每 个 结 点 ， 可 以 讲 得 更 
多 。 注 意 有 4 棵 可 能 的 3 星 树 。V 中 的 所 有 结 e) 

点 连接 到 结 点 4a， 或 者 连接 到 结 点 m。 我 们 并 不 图 9-50 (4%) 
知道 哪 种 情况 更 好 ， 参 见 图 9-51。 假 设 v 是 最 
初 连接 到 a 和 mm 之 间 的 x 结 上 点， 那么 ， 得 到 下 面 的 两 个 不 等 式 : 





w(v, a)<w(v, x) + w(a, x) (9-17) 
w(v, m)<w(y, x) + w(x, m) (9-18) 


NU 一 


图 9-51 结 点 v 或 者 a 或 者 到 m 的 连接 


因为 wv, x)<dtv, P), 以 及 wla, 如 + w(x，m)<di(a，m)， 根据 式 (9-17) GK (9-18) 
的 和 ， 可 以 得 到 


wy, a) + wv, m)<2dt(v, P)+ di(a, m) 


或 者 
w(v,a) + w(v,m) < dt(v,P)+ dt(a,m) 
2 (9-19) 
进而 ， 可 以 得 到 : 
> w(v,a) +S w(v,m) = > (w(v, a) + wlv,m)) (9-20) 


BA. Dovo eat Sem) hp JOON 。 在 Yun 或 Win 中 最 多 有 nm/6 个 结 


点 。 令 v 为 Vw UVsm 中 的 结 点 ， 上 面 的 推理 得 出 在 4 棵 3 星 树 之 一 ， 从 Vom UVow 中 所 有 结 点 出 发 
的 边 权 值 之 和 不 大 于 : 
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any 1 \ 
6 de P)+ 5 (dt(a,m) + dt(b,m)) j 


(3) FRR (a, mkb, m), ERREKAR PIRRE & F(n/2)(n/2) = (wR. 
总 之 ， 在 4 棵 3 星 树 之 -~-， 其 路 径 代 价 记 为 RC(3 星 ，G)， 满 足下 面 的 公式 : 
RC(3 星 ，G) 
a 
\12) \4 
(1\ 2 

< n9 dP + 3) w(P) 

由 式 (9-16) ， 可 以 得 到 : 

RCGE, G)< = mrcst(G) 

因此 , 证 明了 对 于 误差 率 = 112， 存 在 一 棵 最 小 路 径 代 价 生成 树 的 路 径 代 价 不 大 于 3/2 的 3 
星 树 。 


上 面 证 明了 3 星 树 的 存在 性 。 问 题 是 如 何 找到 这 棵 3 星 树 ， 下 面 将 加 以 解释 。 
想像 在 所 有 的 n 个 结 点 中 选取 3 个 结 点 ， 表 示 为 4、b 和 c。 这 三 个 结 点 是 3 星 树 中 仅 有 的 内 


< (n- DY arov, P)+ } (dram) + ditb) + {2 \n?w(P) 


Ma. Be Mm ATAG, j, O, Hbi, j, TERR, Hi+jtk = n-3。 这 是 说 将 连接 i 
个 结 点 到 a，j 个 结 点 连接 到 b，k 个 结 点 连接 到 c， 如 图 9-52 所 示 。 


接 下 来 的 问题 是 ， 哪个 结 点 应 该 与 结 点 a 
连接 ， 哪 j 个 结 点 应 该 与 结 点 b 连 接 ， 哪 k 个 结 
AMA Se AER? 为 解决 这 个 问题 ， 必 须 
解决 二 分 图 的 匹配 问题 。 在 一 个 二 分 图 中 ， 有 
两 个 结 点 的 集合 ， 表 示 为 X 和 7。 在 这 里 ， 原 始 
输入 图 是 G(V, E)。 对 于 二 分 图 , X=V-{a, b, .. . wee 
c}, 了 包含 i 份 的 结 点 a，j 份 的 bp»，K 份 的 c。 在 X e i +1 i j ol le k > 
中 的 结 点 与 了 中 结 点 之 间 边 的 权 值 可 以 在 原始 图 9 oy 有 (+ ONFA ANDER 
输入 距离 矩阵 中 找到 。 在 二 分 图 上 解决 最 小 完 
美 匹配 问题 (minimum perfect matching problem ) 。 如 果 X 中 的 结 点 "与 了 中 的 结 点 x 匹 配 ， 那 么 
在 3 星 树 中 v 将 连接 到 xu。 如 果 结 点 a，b 和 c 以 及 整数 :，j 和 k 确 定 了 ， 那 么 这 棵 3 星 树 就 是 最 优 的 
3 星 树 。 这 棵 3 星 树 的 总 路 径 代价 可 以 相当 容易 地 找到 。 叶 子 结 点 与 内 部 结 点 之 间 的 边 计 数 了 
恰好 (一 DD) 次 。a 和 b 之 间 的 边 计 数 了 (i G+ o tjit, bicz ARA TU G +k) +k (i 
+ 间 次 。 叶 子 结 点 与 内 部 结 点 之 间 的 每 条 边 计数 了 (n 一 ) 次 。 

求解 总 路 径 代价 不 超过 最 小 代价 路 径 树 3/2 的 3 星 树 算法 表示 如 下 : 


算法 9-10 求解 总 路 径 代价 不 超过 最 小 路 径 代 价 树 3/2 的 3 星 树 算法 


输入 : 一 个 所 有 的 边 带 权 值 ， 且 所 有 权 值 满足 三 角 不 等 式 的 完全 图 C(V， 局 )。 
输出 ， 总 路 纶 代价 不 超过 G6 的 最 小 路 径 代价 树 312 的 3 星 树 。 
令 RC = x。 
For 所 有 (a，b，c)， 其 中 a、b 和 c 是 从 V 中 挑选 出 do 
For AARG, J, O. Hebit y+ ken-3, i, j PKA ERR do 
今 X=V-{a,，b，c},，Y 包 含 i 份 的 a、j 份 的 b 和 k 份 的 c。 
在 XX 和 YY 之 间 执 行 一 个 完美 最 小 二 分 匹配 。 如 果 结 点 v 存 匹配 中 连接 4、b 或 c， 将 这 个 结 点 v 分 别 与 a、6。 
或 连接。 这 就 建立 了 一 棵 3 星 树 。 
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计算 这 棵 3 星 树 的 总 的 路 径 代价 Z。 
MEZ FRC, ERC = Z。 
邻 这 棵 3 性 树 为 最 优 的 3 是 树 。 


对 上 面 算法 的 时 间 复 杂 度 分 析 如 下 : 挑选 4，b 和 c 有 O(n ) 种 可 能 的 方法 。 挑 选 i，j 和 有 
O(n) 可 能 的 方法 。 完 美 最 小 二 分 匹配 问题 可 以 在 0O(ww) 时 间 内 解决 。 因 此 ， 解 决 近似 3 星 树 的 
时 间 复 杂 度 为 O(n*)。 

合适 的 大 星 树 可 以 用 相同 的 方式 解决 。 我 们 不 打算 深入 此 细节 。 一 般 来 讲 ， 求 解 总 的 路 径 
代价 不 超过 最 小 路 径 代价 树 (KE +3) + ZEIT Te) SE REE O(n), TER, k= Ža 。 


因此 ， 无 论 E 多 小 ， 总 有 一 个 产生 误差 在 该 误差 率 界 限 中 的 k 星 树 的 多 项 式 近 似 算 法 。 总 之 ， 
存在 一 个 最 小 路 径 代价 生成 树 问题 的 PTAS。 


9.12 NPO 完 全 性 


在 第 8 章 中 讨论 了 NP 完全 性 的 概念 。 如 果 一 个 判定 问题 是 NP 完全 的 ， 那 么 在 多 项 式 时 间 
内 解决 是 极 不 可 能 的 。 

在 本 节 中 ， 将 介绍 NPO 完 全 性 。 将 证 明 ， 如 果 一 个 优化 问题 是 NPO 完 全 的 ， 那 么 极 不 可 
能 存在 一 个 多 项 式 的 近似 算法 ， 它 产生 一 个 有 常数 误差 率 的 近似 解 。 换 句 话说 ，NPO 完 全 类 
问题 表示 不 可 能 有 好 的 近似 算法 的 一 类 优化 问题 。 

首先 ， 定 义 NPO 问 题 的 概念 。 回 顾 一 下 ，NP 集 由 判定 问题 组 成 。NPO (non-deterministic 
polynomial optimization) 集 是 由 优化 问题 组 构成 的 。 现 在 处 理 优化 问题 ， 对 可 行 的 最 优 解 感 
兴趣 。 如 果 一 -个 优化 问题 在 NPO 中 ， 那 么 该 问题 的 可 行 解 可 以 通过 猜测 和 验证 找 出 。 假 设 该 
问题 有 可 行 解 ， 那 么 猜测 阶段 总 是 会 正确 地 对 它 定 位 。 当 然 还 应 假设 验证 花费 多 项 式 级 的 步 
数 。 值 得 注意 的 是 猜测 阶段 仅 产 生 一 个 可 行 解 ， 该 可 行 解 不 必 是 最 优 的 。 

例如 ， 旅 行商 问题 是 一 个 NPO 问 题 ， 因 为 它 是 一 个 最 优化 问题 ， 我 们 总 是 可 以 猜测 一 个 
同 路 并 输出 该 回路 的 长 度 。 当 然 ， 不 能 保证 这 个 猜测 的 输出 是 最 优 解 。 

现在 ， 定 义 NPO 完 全 性 的 概念 。 首 先 定义 规约 ， 称 为 严格 规约 (strict reduction), ， 如 图 9- 
53 所 示 ， 定 义 如 下 : 7 

已 知 NPO 问 题 4 和 B， 称 (/，8) 是 从 4 到 有 的 一 个 严格 规约 ， 如 果 

(1) 对 于 A 中 的 每 个 实例 x，f (Xx) 是 B 中 的 一 个 实例 。 

(2) 对 于 B 中 f (x) 的 每 个 可 行 解 >»，g(y) 是 4 中 的 一 个 可 行 解 。 

(3) g(y) 相 对 于 x 的 最 优 绝对 误差 小 于 等 于 y 相 对 于 B 中 fx) 的 最 优 绝对 误差 。 也 就 是 lg(y) 一 
OPT, (x)l<ly—OPT, F (x)), 





在 定义 了 NPO 问 题 和 严格 规约 之 后 ， 可 以 问题 4 问题 8 
定义 NPO 完 全 问题 了 。 一 个 NPO 问 题 是 NPO 完 
会 的， 如 果 所 有 的 NPO 问 题 严格 规约 到 该 问题 。 C> E) 


可 以 看 出 ， 如 果 问 题 4 严格 规约 为 问题 了 ， 
并 且 B 有 一 个 相对 于 最 优 的 误差 小 于 e 的 近似 算 
法 ， 那 么 可 以 用 它 来 构建 4 的 近似 算法 ， 其 误 
差 可 以 保证 小 于 es。 如 果 一 个 最 优 问 题 4 严格 规 


约 为 一 个 优化 问题 8， 那 么 事实 上 问题 B 有 一 个 © 6 
具有 常数 性 能 比 的 近似 算法 ， 这 隐 含 着 问题 4 


也 有 一 个 具有 常数 性 能 比 的 近似 算法 。 因 此 ， 图 9-53 严格 规约 的 概念 


So 人 CO sol p(f(x)) 
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如 果 -- 个 NPO 完 全 问题 有 任 一 常数 比 的 近似 算法 ， 那 么 所 有 的 NPO 问 题 都 有 常数 比 的 近似 算 
法 。 因 此 ， 确 定 了 问题 4 的 难度 。 

在 第 8 章 中 ， 介 绍 了 第 一 个 正式 的 NP 完 全 回 题 : 可 满足 性 问题 。 在 本 节 将 介绍 带 权 的 可 满 
足 性 问题 (weingted satisfiability problem)， 并 描述 为 什么 带 权 可 满足 性 问题 是 NPO 完 全 的 。 

最 小 (最大) 带 权 可 满足 性 问题 (minimum (maximum) weingted satisfiability problem) 
定义 如 下 : 已 知 布尔 公式 BF， 其 中 每 个 变量 x; 分配 一 个 正 的 权 值 w(x; )。 我 们 的 目标 是 找到 福 
足 BF 所 有 变量 的 真 值 赋值 ， 并 使 得 下 式 最 小 (最 大 ) 

Sw) 

我 们 将 忽略 带 权 可 满足 性 问题 的 NPO 完 全 性 的 形式 证 明 。 正 如 在 第 8 章 所 介绍 的 ， 应 该 举 
一 些 例子 来 说 明 最 优化 问题 是 如 何 严 格 规约 到 带 权 可 满足 性 问题 的 。 

例如 ， 考 虑 找 出 在 两 个 数 a, 和 a 中 的 最 大 数 问 题 。 这 个 例子 的 严格 规约 f (x) 如 下 : 对 于 
a, 《及 a,) ， 将 xi(x2) 与 a1(a2) 相 联系 ，f oH a, (Ka) 映射 到 最 大 带 权 可 满足 问题 的 一 个 问题 
实例 如 下 : 

BF: (x, Vx.) A (~x; V —x2) 

对 于 i = 1，2， 令 w(x;) = a;。 对 于 每 个 满足 BF 的 真 值 指派 ， 的 确 每 个 变量 都 是 真 的 。 如 果 
ai(a2) 是 最 大 ， 那 么 指派 给 xi(x) 的 真 值 指派 为 真 。 

函数 g(xX) 定 义 如 下 


8(X1, =x) = a, 
8(—XI, X2) =a, 
BY DLS (Xx) 和 g(x) 构 成 了 最 大 化 问题 与 最 大 带 权 可 满足 性 问题 之 间 的 一 个 严格 规约 。 
例 : 最 大 独立 集 问题 
最 大 独立 集 问题 定义 如 下 : 已 知 图 G = (V，E)， 找 出 V' SEV, 使 得 V' 是 独立 的 ， 且 IV' 最 大 。 
如 果 对 于 所 有 的 x，vES， 边 (4，v)KE， 那 么 称 顶点 集 5 是 “独立 的 ”。 
参见 图 9-54。 
这 个 例子 的 严格 规约 / (x) 如 下 : ? 
1. 对 于 每 个 顶点 i KBE RA. Jæ tts Jis f 将 3 
它 映射 到 子 句 i 
X; (XR ) 
2. 对 于 每 个 i,，w(x;)= l. 4 
图 9-54 中 的 实例 变换 为 
$ = (x> (—x5&—x)) 
& (x, (—x, & —X3)) 
& (x3 (—x,&—x,)) 
& (x4 (—x3)) 
&(x5—>(—x,)) 
函数 8 定义 为 : 8(X) = {ilx, EX Hx, AR}. 
可 见 对 于 满足 $ 的 每 个 真 值 指派 X，sg(X) 是 一 个 独立 集 。 在 最 大 独立 集 与 最 大 带 权 可 满足 
性 问题 之 间 的 严格 规约 就 建立 起 来 了 。 
证 明 NPO 完 全 性 的 例 
从 上 面 的 例子 中 ,读者 应 该 确信 总 是 可 以 成 功 将 任何 NPO 问 题 变换 为 带 权 可 满足 性 问题 





图 9-54 最 大 独立 集 问题 的 例子 





(WSAT)。 这 是 我 们 本 质 上 讲 的 “WSAT 是 NPO 完 全 的 ”， 例 如 ， 所 有 的 NPO 问 题 都 可 以 严格 
规约 到 它 。 

现在 证 明 一 些 问题 是 NPO 完 全 的 。 应 该 提醒 读者 ， 当 想 证 明 一 个 问题 4 是 NPO 完 全 的 ， 通 
常 在 下 面 两 步 内 证 明 : 

(1) 首先 证 明 4 是 一 个 NPO 问 题 。 

(2) 然后 证 明 某 个 NPO 完 全 问题 严格 规约 为 4。 

注意 直到 现在 ， 只 有 一 个 NPO 完 全 性 问题 : 带 权 可 满足 性 问题 。 为 产生 更 多 的 NPO 完 全 
性 问题 ， 必 须 从 它 开 始 。 也 就 是 说 ， 我 们 应 该 尽力 证 明 带 权 可 满足 性 问题 严格 规约 到 我 们 感 
兴趣 的 问题 。 

Gil: 0-1 整 数 规划 

0-1 整 数 规划 问题 (zero-one integer programming) 定义 如 下 : 已 知 一 个 mxz 的 整数 矩阵 4， 
整数 m 矢 量 ， 正 整数 z 矢 量 c， 找 一 个 满足 4x>>p， 且 使 得 cx 最 小 的 0-1 "矢量 x。 

当然 ， 容 易 看 出 这 个 问题 是 一 个 NPO 问 题 。 对 于 任何 非 确定 性 猜测 解 X， 可 以 在 多 项 式 时 
间 内 验证 是 否 4x>bp， 且 对 cx 的 验证 也 可 在 多 项 式 级 时 间 内 计算 。 

在 证 明 0-1 整 数 规划 问题 的 NPO 完 全 性 之 前 ， 首 先 要 介绍 最 大 或 最 小 ， 带 权 3 可 满足 性 问 
题 (W3SAT)。 最 大 (最 小 ) 带 权 3 可 满足 性 问题 定义 (maxmum (minimum) weingted 3- 
satisfiability problem) 如 下 : 已 知 布尔 公式 $9 是 由 子 句 所 组 成 ， 其 中 每 个 子 句 只 包含 三 个 文字 ， 
以 及 与 x 有 关 的 正 整数 权 值 w(x; )，i = 1，2，3。 找 到 满足 9 的 指派 (x; )， 如 果 存 在 这 个 指派 ， 
那么 它 将 最 大 (最 小 ) 化 下 式 

yn 
PEAST 


令 w(x1) 三 3， w(X2) = 5, w(x) = 26 考虑 下 面 的 公式 
(-x, V =x, V—X;) 
&(-x, V-X, V-X) 
&(-x, V =x, V xX) 


&(X, VX, Vx) 


有 4 个 指派 满足 上 面 的 公式 : 
(x1, X25 x3) AS 
(Xi1， 一 Xx2， 一 X3) 带 权 值 为 3 
(X Xo, x5) ARAB AT 
以 及 (一 x1/，x2， 一 x3) 带 权 值 为 5。 
指派 (x1，x2，x3) ((x1:， 一 x2， 一 x3) 是 最 大 《最 小 ) W3SAT 问 题 的 解 。 最 大 和 最 小 W3SAT 
问题 都 是 NPO 完 全 的 。 为 了 证 明 0-1 整 数 规划 问题 是 NPO 完 全 的 ， 将 证 明 最 小 W3SAT 可 以 严格 
规约 到 它 。 
将 最 小 W3SAT 问 题 转换 为 0-1 整 数 规划 问题 的 函数 /如 下 : 
(1) 在 最 小 W3SAT 中 的 每 个 变量 x 对 应 0-1 整 数 规划 问题 中 的 一 个 变量 x。 
(2) 变量 值 1 代表“TRUE”， 值 0 代表 “FALSE”, 
(3) W3SAT 中 的 每 个 子 句 转换 为 一 个 不 等 式 。 运 算 符 “or” 转 换 为 “+”，-x 转 换 为 1 一 x。 
由 于 整个 子 句 必须 为 真 ， 所 以 应 使 它 “ 之 1”。 
(4) 令 w(x;) (i = 1，2，3) 表示 变量 x, 的 权 值 ， 那 么 将 下 面 的 函数 最 小 化 : 
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> W(X, )X; 


权 值 为 w(x1) = 3, wa) = S 和 w(0oa) = 5 的 最 小 W3SAT 问 题 (xz V x V X3)8(—x, V 一 XV x3) AE 
换 为 下 面 的 0-1 整 数 规划 问题 : 

最 小 化 3x + 5x +5x;3， 其 中 x;=0, 1 

约束 为 atat, Lx + l-n 44,21 

最 小 W3SAT 问 题解 的 一 个 为 真 的 指派 (x1， 一 x*2，x;) 对 应 于 矢量 (0，0，1)， 该 矢量 是 0-1 
整数 规则 问题 的 一 个 解 。 困 此 ， 带 权 3 可 满足 性 问题 严格 规约 为 0-1 整 数 规划 问题 。 所 以 ，0-1 
整数 规划 问题 是 NPO 完 全 的 。 

p: 图 上 的 最 长 和 最 短 哈 密 顿 回路 问题 

已 知 一 个 图 ， 一 条 哈密 顿 回路 是 遍历 图 中 所 有 结 点 仅 一 次 的 回路 。 图 上 的 最 长 (最短 ) 
哈密 顿 回路 问题 (longest (shortest) Hamiltonian cycle problem) 定义 为 : 已 知 一 个 图 ， 找 到 这 
个 图 的 最 长 (最短) 哈密 尔 顿 回路 。 这 两 个 问题 都 是 NP 难 的 。 最 短 哈密 尔 顿 回路 问题 也 称 为 
旅行 商 问题 。 下 面 将 证 明 这 两 个 问题 都 是 NPO 完 全 的 。 显 然 这 两 个 问题 都 是 NPO 问 题 ，NPO 
完全 性 可 以 通过 证 明 最 大 或 最 小 W2SATI 回 题 严格 规约 到 它 来 建立 。 

首先 ， 已 知 W3SAT 问 题 的 实例 pg， 将 证 明 : 

1. 存在 将 和 赂 射 到 图 f (上 的 函数 / ， 使 得 W3SAT 是 可 满足 的 ， 当 且 仅 当 f (办 有 一 条 哈密 
顿 回路 。 

2. 存在 将 图 f (办 上 的 哈密 尔 顿 回路 C 映 射 到 对 9 的 可 满足 的 真 值 指派 s(C) 的 函数 g。 

3. C 的 代价 与 g(C) 的 代价 相等 。 


Ci, 

最 后 - -个 性 质保 证 了 g(C) 对 % 的 最 优 解 的 绝对 误 ° 

ESTORT (四 最 优 解 的 绝对 误差 。 也 就 是 ， a 
(CO-OPT(9 = IC-OPTU (@))|. Ak, C, gt 

个 严格 规约 。 Ciz 

现在 说 明 W3SAT 问 题 实例 转换 到 图 的 例子 。 ci ey 

所 示 。 边 e1，e; 和 e; 对 应 于 子 名 C; 中 的 三 个 文字 。 例 Cis 
an, WEC, BZ- Xa 和 一 x;， 那么 e,， ez 和 ei; 分 别 

HET x, Fl. C, 分支 有 一 个 性 质 ， 对 于 任何 k 

从 c lc, ,的 哈密 顿 路 径 ， 在 el、e:，e: 中 至 少 有 一 条 c, 


边 不 会 被 遍历 ， 9-56 所 示 。 人 遍历 
uraman ANL9-SO TAR. JATA RRRA 本 


el el el et 
e e2 €e €2 
e e3 e3 e3 


图 9-56 e,，e:，e 中 至 少 有 一 条 边 不 被 遍历 的 C 分 支 
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(2) 对 十 每 个 变量 V; ， 有 一 个 Vi 分 支 ， 如 图 9-57 所 示 。 对 于 一 条 哈密 顿 路 径 ，x 或 者 x; 会 
被 遍历 。 

(3) 通过 配件 五 连接 VY 分 支 到 C 分 支 ， 如 图 9-58 所 示 。 如 果 图 Vii 
G = (V，E) 包 含 如 图 9-58a 所 示 的 配件 互 = (W, F), (EV -Wp 
设 有 结 点 与 W 一 {4u，v，u',，v 小 中 的 任何 结 点 相 邻 ， 那 么 看 出 G 中 Vi a =; 
的 任何 哈密 顿 回 路 必定 遍历 图 9-S8b 或 者 图 9-$8c 中 的 已 。 

(4) 对 于 一 个 已 知 有 子 甸 Ci，C;，…，C 的 布尔 公式 ， 对 











Vio 
些 . i 一 wee — 
应 这 些 -P RICHY ELLA CC: 4I Cisi) (i 1, 2, ? m 1) 图 9-57 对 应 于 一 个 变量 的 组 件 
串联 。 
b) from u to u' c) from v to v' 
图 9-58 配件 


(5) 对 于 一 个 已 知 有 变量 Xx;,，x,。，… ,x 的 布尔 公式 ， 它 们 对 应 的 Vi 分 支 以 边 (Yi 2，vi44,1) 
(i=1, 2, =, n—1) BK, 

(6) 有 两 条 特殊 的 边 (c 1 Vi, AMC as Vanao 

(7) 如 果 在 子 句 C 中 出 现 x( 一 x)， 那 么 左 ( 右 ) 边 对 应 于 变量 x 的 V 分 支 的 x( 一 x)， 将 会 连接 到 对 
应 于 C 分 支 中 对 应 于 子 句 C 的 变量 x 的 边 。 

一 条 哈密 顿 回路 的 例子 如 图 9-59 所 示 。 注 意 任何 哈密 顿 回路 必须 包含 从 v, 1 到 c ,的 路 径 。 
Me, ,有 两 个 选择 ， 直 接 到 c, ;或 者 其 他 的 路 径 。 在 本 例 中 ， 并 没有 遍历 C1 分 支 中 对 应 于 x 的 
边 。 在 整个 回路 中 ，C | 分支 中 的 x, 和 x 以 及 Cs 分 支 中 的 -x; 都 没有 被 遍历 ， 这 对 应 指派 (xi， 
Xz, X3)0 

通常 有 下 面 的 规则 :在 一 条 哈密 顿 回路 中 ， 如 果 在 C 分 支 中 对 应 x; (—x, ) 的 边 没 有 被 遍历 ， 
那么 在 相应 的 指派 中 x;(-xi) 为 真 。 

根据 上 面 的 规则 ， 如 果 在 回路 中 子 句 C, 中 对 应 于 交 的 边 没 有 被 遍历 ， 那 么 在 赋值 中 ， 置 zi 
为 真 。 读 者 可 能 想 知 道 : 子 句 C:* 中 对 应 于 -xi 的 边 是 否 被 遍历 呢 ? 确实 是 这 种 情况 ， 否 则 ， 
将 会 产生 矛盾 ， 并 且 没 有 相应 的 指派 。 这 样 可 通过 验证 在 VI 分 支 中 的 -x 连接 看 出 。 可 以 
证 明 对 于 G 中 的 任何 哈密 尔 顿 回路 ， 如 果 在 某 个 Cj 分 支 中 对 应 于 x; (一 x; ) 的 边 未 遍历 ， 那 
么 在 这 个 Ci 分 支 中 对 应 于 一 x; (xz ) 的 边 会 被 遍历 。 这 意味 着 G 中 的 每 一 条 哈密 顿 同 路 有 6 的 

一 个 相应 指派 。 

还 应 该 指派 G 中 边 的 权 值 。 指 派 w(xi ) 为 Vi 分 支 的 左边 , i = 1，2,… ， 其 他 的 边 
为 0。 可 以 证 明 图 G 有 一 条 权 值 为 W 的 哈密 顿 回 路 ， 当 且 仅 当 布 尔 2 shone WHAT 
指派 。 

我 们 证 明了 在 最 大 或 最 小 W2SAT 问 题 中 存在 一 个 严格 规约 ， 将 其 规约 为 图 上 最 长 或 最 短 
哈密 顿 回路 问题 。 由 于 最 大 和 最 小 W3SAT 问 题 的 NPO 完 全 性 ， 现 在 最 长 和 最 短 哈 密 顿 回路 问 
题 的 NPO 完 全 都 建立 起 来 了 。 





250 





V2 

















ee 


图 9-59 指派 为 (一 局 s X25 x) A(x, V Xa V x3) 和 (—x V 一 总 V —x,) 


913 注释 与 参考 


欧 几 里 得 旅行 商 问题 的 NP 难度 是 由 文献 Papadimitriou(1977) 所 证 明 。 文 献 Rosenkrantz， 
Stearns and Lewis(1977) 证 明了 欧 几 里 得 旅行 商 问题 的 近似 长 度 可 以 小 于 最 短 回路 的 两 倍 。 文 
献 Christofides(1976) 讲 述 了 最 小 生成 树 、 匹 配 以 及 旅行 商 问题 ， 以 得 到 长 度 在 最 优 解 3/2 内 的 
欧 儿 里 得 旅行 商 问题 的 近似 算法 。 在 9.3 节 和 9.4 节 中 讨论 的 瓶颈 问题 最 初 分 别 在 文献 Parker 
and Pardin(1984), Hochbaum and Shmoys(1986) 中 出 现 。 装 箱 近 似 算法 在 文献 Johnson(1973) 
中 出 现 。 直 线 m 中 心 问题 的 近似 算法 由 文献 Ko，Lee and Chang(1990) 给 出 。 

术语 NPO 完 全 性 首先 出 现在 文献 Ausiello Crescenzi and Protasi(1995) 中 ， 但 是 这 个 概念 
最 初 在 Orponen and Mannila(1987) 中 介绍 。 在 文献 Orponen and Mannila(1987) 中 , 0 一 1 整数 规 
划 问 题 、 旅 行商 问题 和 最 大 带 权 3 可 满足 性 问题 都 证 明 是 NPO 完 全 的 。 最 长 哈密 顿 路 径 问 题 的 
NPO 完 全 的 证 明 可 以 在 文献 Wu，Chao and Lee(1998) 中 找到 。 

旅行 商 问题 很 难 有 好 的 近似 算法 ， 这 在 文献 5ahni and Gonzalez(1976) 中 有 证 明 。 他 们 证 
明了 如 果 旅 行商 问题 有 任何 常数 的 近似 率 ， 那 么 NP = P。 注 意 这 是 对 于 一 般 情况 。 对 于 特殊 
情况 是 有 好 的 近似 算法 的 。 

求解 0/1 背 包 问 题 PTAS 的 一 个 聪明 方法 由 Ibarra and Kim(1975) 发 现 。Baker 发 展 了 平面 图 
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上 的 几 个 问题 的 PTAS(Baker，1994)。 如 果 将 其 限制 在 平面 (Grigni，Koutsoupias ， 
Papadimitriou, 1995) 或 者 欧 几 里 得 中 (Arora，196) ， 那 么 旅行 商 问题 是 有 PTAS 的 。 最 小 路 
径 代 价 生 成 树 问题 的 PTAS 方 案由 文献 Wu，Lancia，Bafna，Chao，Ravi and Tang(2000) 给 出 。 
另 一 个 感 兴趣 的 PTAS 方 案 可 以 在 文献 Wang and Gusfield(1997) 中 找到 。 

还 有 田 一 类 问题 ， 记 为 MAX SNP 完 全 问题 ， 由 Papadimitriou and Yannakakis(1991) 提 出 。 
这 类 问题 可 以 由 一 个 严格 名 法 形式 Fagin(1974) 表 示 ， 它 有 一 个 常数 比率 的 近似 算法 。 已 经 证 
明 这 类 的 任何 问题 可 以 有 一 个 PTAS， 当 且 仅 当 NP = P。 有 几 个 问题 ， 如 MAX 3SAT 问 题 、 拖 
阵 旅 行商 问题 、 最 大 叶子 生成 树 问 题 以 及 无 序 标记 树 问 题 ， 都 被 证 明 是 这 一 类 的 。 更 多 细节 
内 容 可 参见 Papadimitriou and Yannakakis(1991); Papadimitriou and Yannakakis(1992), 
Galbiati, Maffioli and Morzenti(1994) 以 及 Zhang and Jiang(1994) , 


9.14 进一步 的 阅读 资料 


对 换 排 序 问题 的 近似 算法 可 以 在 文献 Bafna and Pevzner(1998) 中 找到 。 对 于 多 序列 比 对 问 
题 可 参考 文献 Gusfield(1997)。 文 献 Horowitz and Sahni(1978) 和 Papadimitriou and 
Steiglitz(1982) 都 讨论 了 近似 算法 。 这 个 主题 的 回顾 还 可 以 在 文献 Garey and Johnson(1976) 中 
找到 。 近 几 年 出 版 了 许多 近似 算法 ， 其 中 的 许多 都 与 NP 完全 性 相关 。 推 荐 下 面 的 文章 进一步 
(iz: Alon and Azar(1989); Baker and Coffman Jr.(1982); Bruno, Coffman and 
Sethi(1974), Cornuejols, Fisher and Nemhauser(1977); Friesen and Kuhl(1988), Hall and 
Hochbaum(1986); Hochbaum and Maass(1987); Hsu(1984); Johnson(1974), Johnson, 
Demars, Ullman, Garey and Graham(1987), Krarup and Pruzan(1986),; Langston(1982),; 
Larson(1984), Mehlhorn(1988); Moran(1981); Murgolo(1987); Nishizeki, Asano and 
Watanabe(1983);， Reghavan(1988),; Sahni(1977); Sahni and Gonzalez(1976),; Tarhio and 
Ukkonen(1988), Vaidya(1988) 以 及 Wu, Widmayer and Wong(1986), 

最 近 的 研究 成 果 可 以 在 以 下 文献 中 找到 ; Agarwal and Procopiuc(2000), Akutsu and 
halldorsson(1994); Akutsu and Miyano(1997), Akutsu, Arimura and Shimozono(2000); 
Aldous(1989); Amir and Farach(1995),; Amir and Keselman(1997); Amir and Landau(1991), 
Arkin, Chiang, Mitchell, Skiena and Yang(1999),; Armen and Stein(1994); Armen and 
Stein(1995), Armen and Stein(1996),; Armen and Stein(1998),; Arora, Lund, Motwani, 
Sudan and Szegedy(1998),; Arratia, Goldstein and Gordon(1989), Arratia, Martin, Reinert, 
and Waterman(1996), Arya, Mount, Netanyahu, Silverman and Wu(1998),; Avrim, Jiang, 
Li, Tromp and Yannakakis(1991); Baeza-Yates and Perleberg(1992); Baeza-Yates and 
Navarro(1999),; Bafna and Pevzner(1996); Bafna, Berman and Fujito(1999); Bafna, Lawler 
and Pevzner(1997), Berman, Hannenhalli and Karpinki(2001); Blum(1994), Blum, Jiang, 
Li, Tromp and Yannakakis(1994), Bonizzoni, Vedova and Mauri(2001); Breen, Waterman 
and Zhang(1985); Breslauer, Jiang and Jiang(1997), Bridson and Tang(2001); Cary(2001), 
Chang and Lamp(1992), Chang and Lawler(1994); Chen and Miranda(2001), Chen(1975), 
Christos and Drago(1998), Chu and. La(2001), Clarkson(1994); Cobbs(1995); Czumaj, 
Gasieniec, Piotrow and Rytter(1994),; Dinitz and Nutov(1999),; Drake and Hougardy(2003), 
Esko(1990),; Even, Naor and Zosin(2000); Feige and Krauthgamer(2002); Frieze and 
Kannan(1991); Galbiati, Maffioli and Morrzenti(1994), Galil and Park(1990); Goemans and 
Williamson(1995); Gonzalo(2001),; Gusfield(1994), Hochbaum and Shmoys(1987); 
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Ivanov(1984); Jain and Vazirani(2001); Jiang and Li(1995); Jiang, Kearney and Li(1998); 
Jiang, Kearney and Li(2001); Jiang, Wang and Lawler(1996); Jonathan(1989); Jorma and 
Ukkonen(1988); Kannan and Warnow(1995),; Karkkainen, Navarro and Ukkonen(2000); 
Kececioglu(i991); Kececioglu and Myers(1995a); Kececioglu and Myers(1995b); Kececioglu 
and Sankoff(1993); Kececioglu and Sankoff(1995),; Kleinberg and Tardos(2002),; Kolliopoulos 
and Stein(2002); Kortsarz and Peleg(1995); Krumke, Marathe and Ravi(2001); Landau and 
Schmidt(1993); Landau and Vishkin(1989), Laquer(1981); Leighton and Rao(1999), 
Maniezzo(1998), Mauri, pavesi and Piccolboni(1999); Myers(1994); Myers and 
Miller(1989), Parida, Floratos and Rigoutsos(1999); Pe’er and Shamir(2000); Pevzner and 
Waterman(1995); Promel and Steger(2000); Raghavachari and Veerasamy(1999), 
Slavik(1997); Srinivasan(1999), Srinivasan and Teo(2001); Stewart(1999); Sweedyk(1995), 
Tarhio and Ukkonen(1986); Tarhio and Ukkonen(1988); Tong and Wong(2002); 
Trevisan(2001); Turner(1989); Ukkonen(1985a),; Ukkonen(1985b); Ukkonen(1990), 
Ukkonen(1992), Vazirani(2001); Vyugin and V’yugin(2002),; Wang and Gusfield(1997), 
Wang and Jiang(1994), Wang, Jiang and Gusfield(2000); Wang, Jiang and Lawler(1996), 
Wang, Zhang, Jeong and Shasha(1994); Wateman and Vingron(1994), Wright(1994); Wu 
and Manber(1992),; Wu and Myers(1996)LJ R Zelikovsky(1993), 


习题 


9.1 一 -个 解决 装 箱 问题 的 简单 在 线 近似 算法 是 将 一 件 物品 放 入 第 i 个 箱子 中 ， 否 则 放 入 第 i +1 
个 箱子 中 。 这 个 算法 称 为 最 先 适 应 (FF) 算 法 。 证 明 FF 算 法 得 出 的 箱子 数量 不 多 二 最 优 解 
箱子 个 数 的 两 倍 。 | 

9.2 证 明 如 果 物 品 的 序列 看 成 是 1/2， .1/2n，1/2，1/2n，…，1/2 (一 共有 4n 一 1 项 )， 那 么 FF 算 
法 实际 上 使 用 了 真正 所 需 箱子 个 数 的 两 倍 。 

9.3 证 明 并 不 存在 任何 对 于 旅行 商 问 题 的 多 项 式 时 间 的 近似 算法 ， 使 得 由 近似 算法 产生 的 误 
差 界 限 为 . TSP， 其 中 是 任意 常数 ，TSP 表 示 最 优 解 。 

(提示 : 证 明 哈密 顿 回 路 问题 可 以 归 约 到 这 个 问题 。) 

9.4 使 用 近似 凸 包 算法 求解 下 面 点 集 的 近似 凸 包 。 

9.5 设 有 一 个 点 集 稠 密 地 分 布 在 一 个 圈 上 ， 使 用 近似 欧 儿 里 得 旅行 商 算法 求解 这 个 点 集 的 近 
似 回 路 ， 得 到 的 结果 是 最 优 解 吗 ? 


9.6 考虑 如 下 图 所 示 方 形 中 的 四 个 点 。 使 用 本 章 所 介绍 的 算法 近似 求解 瓶颈 旅行 商 问 题 ，# 
到 的 这 个 解 是 最 优 解 吗 ? 























3 


9.7 对 直线 m 中 心 问题 使 用 近似 算法 找 出 下 面 点 集 的 直线 2 中 心 问题 的 近似 解 。 


9.8 考虑 下 面 的 瓶颈 最 优 问题 。 已 知 平面 上 的 一 个 点 集 ， 找 出 k 个 点 ， 使 得 在 这 k 个 点 中 最 短 
距离 最 大 ， 这 个 问题 由 Wang and Kuo(1988) 证 明 是 一 个 NP 完全 问题 。 设 法 找 出 解决 这 个 
问题 的 近似 算法 。 

9.9 阅读 文献 Horowitz and Sahni(1978) 关 于 调度 独立 任务 近似 算法 的 12.3 节 。 对 下 面 的 调度 
问题 应 用 最 长 处 理 时 间 (LPT) 规 则 : 有 三 台 处 理 器 和 七 项 任务 ,其 中 任务 时 间 为 (11, t,, t, 
ty, ts, te, 17)=(14, 12, 11, 9, 8, 7, 1). 

9.10 编写 一 个 实现 旅行 商 问题 近似 算法 的 程序 ， 以 及 求解 旅行 商 问题 最 优 解 的 分 支 限界 算法 
的 程序 。 比 较 它 们 的 结果 ， 总 结 出 你 的 结论 ， 使 用 这 样 的 近似 算法 值得 吗 ? 





第 10 章 分 摊 分 析 


在 本 章 中 ， 我 们 将 关注 一 系列 操作 的 时 间 复 杂 度 。 假 如 考虑 一 系列 操作 OP,，0P,，…， 
OP, ， 想 确定 这 个 操作 序列 可 能 花费 的 最 长 时 间 。 人 们 的 立即 反映 可 能 是 考查 每 种 操作 OP 
的 最 坏 情 况 时 间 复 杂 度 。 然 而 ， 操 作 序列 OP,，OP:，…，OP, 可 能 的 最 长 时 间 是 每 种 操作 
OP, 花费 的 最 坏 时 间 # 之 和 ， 并 不 总 是 正确 。 原 因 相当 简单 ， 我 们 并 不 希望 最 坏 情况 频繁 地 
发 生 。 

为 了 更 加 明确 ， 想 象 我 们 每 个 月 到 银行 存 一 次 钱 ， 只 要 银行 里 有 存款 ， 就 可 到 百货 公司 
去 消费 。 现 在 立即 就 明白 在 某 个 月 的 消费 依赖 于 前 几 个 月 的 存款 。 如 果 在 十 月 份 花 钱 大 手 大 
脚 ， 那 么 在 十 月 之 前 的 几 个 月 应 是 非常 节俭 的 。 另外， 十 月 以 后 ， 由 于 所 有 存款 花 完 了 ， 又 
必须 再 存 钱 ， 想 奢侈 地 花 钱 又 得 等 几 个 月 了 。 

上 面 的 讨论 说 明了 一 点 ， 操 作 是 相互 关联 的 ， 不 能 假定 它们 是 相互 独立 的 。 

“oy ie" (amortized) 意味 着 现在 我 们 完成 许多 存款 ， 使 得 在 将 来 能 够 消费 。 为 什么 
“分 挫 ” 与 算法 分 析 有 联系 呢 ?” 后 面 将 会 明白 ， 在 很 多 情况 下 ,“ 分 摊 ” 意 味 着 对 数据 结构 
所 做 的 操作 似乎 浪费 了 时 间 。 然 而 ， 对 数据 结构 的 这 种 操作 在 后 面 可 以 得 到 补偿 。 也 就 是 采 
取 这 些 行动 之 后 ， 后 面 的 事情 将 变 得 更 容易 些 。 我 们 年 轻 时 努力 地 工作 ， 就 是 在 年 老 时 收获 
回报 。 


10.1 使 用 势能 函数 的 例子 


对 我 们 来 说 势能 是 一 个 熟知 的 概念 。 为 了 利用 水 的 能 量 ， 我 们 必须 提升 水 ， 使 其 “势能 ” 
变 高 。 只 有 当 水 的 势能 达到 一 定时 ， 才 可 利用 水 。 我 们 在 银行 里 存 的 钱 也 可 看 作 是 势能 ， 只 
有 在 有 了 足够 的 存款 之 后 才 可 能 消费 。 

在 本 节 中 ， 将 说 明 如 何 利 用 势能 函数 的 概念 进行 分 摊 分 析 。 考 虑 操作 序列 OP，OP:，…， 
OP,, ， 其 中 每 个 OP, 由 多 个 元 素 出 栈 和 一 个 元 素 入 栈 组 成 。 假 如 每 个 人 栈 和 出 栈 花费 一 个 时 间 
单位 ， 令 4 表示 OP 花费 的 时 间 ， 那 么 总 的 时 间 是 


7T- 2 


每 个 操作 的 平均 时 间 是 
tive = > im 
我 们 的 任务 是 确定 zue o 
读者 可 以 看 出 ru。 是 不 容易 找 出 的 。 在 介绍 使 用 势能 函数 概念 找 出 1, 之 前 ， 先 举 一 个 例 
子 : 
S, l push 1 push 2 pops 1 push l push 1push 2pops 1 pop 


1 push l] push 1 push 
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t; 1 1 3 l l 1 3 2 
lv=(I+1+3+1+1+1+3+2)8=13/8 = 1.625 

i l 2 3 4 5 6 7 8 

S$, l push 1 pop 1 push 1 push l push l push Spops 1 push 

1 push 1 push 

t; l 2 1 1 1 1 6 1 
tue= (1 +24+1414+1414+641)/8 = 14/8 = 1.75 

i l 2 3 4 5 6 7 8 

S, 1 push 1 push l push lpush 4pops 1push lpush 1 pop 

1 push 1 push 





t, 1 1 1 1 5 1 1 2 
tau =(1+1+14+1+5+1+1 4+2 )/8 = 13/8 = 1.625 


读者 一 定 注意 到 ， 对 于 每 种 情况 都 有 ti <2。 实 际 上 ，t6。 是 很 难 找 出 的 。 但 我 们 能 够 证 
明确 有 一 个 上 界 为 2。 得 到 这 个 结论 是 因为 每 次 OP; 后 ， 不 仅 完成 了 一 次 操作 ， 而 且 改 变 了 
栈 中 的 内 容 ， 栈 中 元 素数 量 增加 或 者 减少 。 如 果 增 加 ， 那 么 执行 多 次 出 栈 操 作 的 能 力也 增加 。 
在 某 种 意义 上 ， 当 一 个 元 素 入 栈 时 ， 我 们 增加 了 势能 ， 易 于 完成 许多 出 栈 操 作 。 男 一 方面 ， 
由 于 从 栈 中 弹出 一 个 元 素 ， 就 以 某 种 方式 减少 了 势能 。 

令 0 =t + 9; =$- Eho ARREOP, 之 后 栈 的 势能 函数 。 这 样 ， 外 一 $1 是 势能 的 改变 。 


那么 
DD 


m 


= >" + 内 -Po 
WRG, 一 %20, BBA >a 代表 >! 的 一 个 上 界 。 也 就 是 


n m 


Da (1) 


现在 直接 定义 四 为 第 ;次 操作 后 栈 中 元 素数 ， 容 易 得 到 各 一 加 >0。 假 定 在 执行 OP, 之前， 
栈 中 有 Kk 个 元 素 ，OP; 由 nn 次 出 栈 和 1 次 入 栈 组 成 ， 即 
由 -= 大 
go, = k-n+ 1 
t=antl 
a= t+ 9 — $I 
=n + l + (k-n + 1)—k 
=2 


从 上 面 的 等 式 ， 很 容易 证 明 


Dk 
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m 


所 以 ， 根 据 (1)， Iu =D him J alm=2, 也 就 是 1 <2, 


实际 上 ， 对 于 这 种 情况 不 必用 势能 函数 推导 上 界 2。 当 然 不 需要 。 对 m 次 操作 ， 至 多 有 mm 
次 push 入 栈 和 m 次 pop 出 栈 ， 因 为 出 栈 的 数量 不 可 能 超过 入 栈 的 数量 。 因 此 ， 至 多 可 能 有 2m 个 
动作 ， 平 均 时 间 不 可 能 超过 2。 

尽管 对 于 如 此 简单 的 例子 可 以 不 必 使 用 势能 函数 ， 但 对 其 他 情况 却 需 要 使 用 ， 正 如 在 下 
一 节 将 要 看 到 的 。 

最 后 ， 需 要 提醒 读者 w <2 不 应 解释 为 <2。t; 的 值 可 以 非常 高 ， 远 超过 2。 然 而 ， 如 果 t 
在 当前 很 高 , 那么 在 未 来 将 是 很 小 的 。 当 前 ;很 高 的 事实 意味 着 栈 中 元 素 在 将 来 要 大 幅 地 减少 。 
或 者 用 另 一 说 法 ， 如 果 它 是 高 的 ， 势 能 将 会 急剧 降低 。 这 与 自然 现象 类 似 。 如 果 要 利用 大 量 
的 水 ， 那 么 资源 的 势能 将 会 降低 ， 将 来 就 没有 可 利用 的 水 了 。 


10.2 斜 堆 的 分 摊 分 析 


在 斜 堆 (skew heap) 中 ， 基 本 的 操作 称 
为 “合并 ”(meld)。 参 见 图 10-1， 为 合并 这 两 (1) 
个 斜 堆 ， 先 将 两 棵 斜 堆 的 右 路 径 合并 成 一 个 ， (50】 io) © 
然后 将 左 分 支 连接 到 合并 路 径 中 的 结 点 ， 如 图 © 四 O 
10-2 所 示 。 在 这 一 步 之 后 ， 除 了 最 低 的 结 点 ， 
交换 合并 路 径 中 的 每 个 结 点 的 左右 孩子 。 (is) (25) 

图 10-3 显 示 了 交换 后 的 结果 。 正 如 所 看 到 图 10-1 BURR 
的 ， 尽管 不 能 保证 右 路 径 最 短 ， 但 是 合并 后 的 
斜 堆 趋 向 于 有 最 短 的 右 路 径 。 然 而 ， 实 现 合并 操作 是 很 容易 的 ， 从 分 摊 意 义 上 ， 这 能 产生 好 
的 性 能 。 





图 10-2 图 10-1 中 两 棵 斜 堆 的 合并 图 10-3 图 10-2 中 斜 堆 的 最 左 、 最 右 路 径 的 交换 


象 斜 堆 这 样 的 数据 结构 需要 许多 操作 ， 实 际 上 对 斜 堆 可 以 实现 以 下 的 操作 : 

(1) find-min(h): 找 出 斜 堆 R 中 的 最 小 者 。 

(2) insert, A): 将 元 素 x 插 入 斜 堆 p 中 。 i 
(3) delete-min(h): 从 斜 堆 pz 中 删除 最 小 者 。 

(4) meld(h,, h,): BHT BEA Mh. 
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前 三 个 操作 通过 合并 即 可 完成 。 例 如 ， 对 于 插入 元 素 x 的 操作 ， 可 将 x 看 作 只 有 一 个 元 素 
的 斜 堆 ， 然 后 合并 这 两 个 斜 堆 。 类 似 地 ， 当 删除 最 小 元 素 时 ， 它 总 是 斜 堆 的 根 ， 我 们 可 以 有 
效 地 将 该 斜 堆 拆 分 成 两 个 斜 堆 ， 然 后 再 合并 新 生成 的 两 个 斜 堆 。 

由 于 所 有 的 操作 都 基于 合并 操作 ， 可 以 将 一 个 由 删除 、 插 入 和 合并 组 成 的 操作 序列 看 作 
一 个 合并 操作 序列 。 所 以 ， 只 需 分 析 合 并 操作 。 在 分 析 前 ， 注 意 合并 操作 一 个 有 趣 的 性 质 : 
如 果 在 合并 上 花费 很 多 时 间 ， 那 么 由 于 交换 的 影响 ， 右 路 径 将 变 得 非常 短 。 因 此 ,合并 操作 
并 不 再 是 非常 耗 时 的 ， 势 能 就 简单 地 消失 了 。 

为 了 完成 分 摊 分 析 ， 再 次 令 

a, = 二 十 轴 一 办 
其 中 i; 是 操作 OP, 的 耗 时 ， 几 和 由 分别 是 操作 OP, 之 后 与 之 前 的 势能 。 另 外 还 有 


m m 
D7 Di tbe te 
{= i= 


405 by 一 向 >0， 那 么 Şa 看 作 任意 m 次 操作 所 花费 实际 时 间 的 上 界 。 


现在 的 问题 是 定义 一 个 好 的 势能 函数 。 令 wi(x) 表 示 包 括 结 点 x 的 子孙 数 ， 重 结 点 (heavy 
node) x 是 非 根 结 点 ， 且 wi(x)>wi(p(x))/2， 其 中 p(X) 是 x 的 父 结 点 。 反 之 ， 结 点 x 是 轻 结 点 
(light node), 

考虑 图 10-2 所 示 的 斜 堆 ， 结 点 的 权 值 表示 在 表 10-1 中 。 


表 10-1 图 10-2 中 结 点 的 权 值 








要 注意 每 个 叶 结 点 必定 是 轻 结 点 。 另 外 ， 如 果 某 个 结 点 是 轻 的 ， 那 么 至 少 与 它 的 兄弟 结 
点 比较 时 ， 它 没有 太 多 的 子孙 。 例 如 ， 在 图 10-2 中 的 结 点 13 和 19 都 是 轻 结 点 。 它 们 的 兄弟 结 
点 是 重 结 点 。 此 树 或 该 斜 堆 向 许多 重 结 点 方 倾 斜 。 注 意 在 图 10-2 中 的 斜 堆 ， 所 有 在 右 路 径 中 
的 结 点 都 是 重 结 点 ， 该 路 径 是 条 长 路 径 。 另 一 方面 ， 考 虑 图 10-3 ， 该 斜 堆 的 右 路 径 没 有 重 结 
点 ， 它 是 条 短路 径 。 

如 果 某 个 结 点 是 另 一 个 结 点 的 在 (E) BT, BARBER AA (A) 结 点 (right(left) 
node), 4 (A) 重 结 点 是 右 (A) 结 点 为 重 的 。 我 们 可 以 将 针 堆 的 右 重 结 点 数 作为 势能 函数 。 
因此 ， 对 于 图 10-2 中 的 斜 堆 ， 势 能 是 35， 图 10-3 中 的 斜 堆 的 势能 是 0。 

现在 调查 一 个 非常 重要 的 问题 。 合 并 前 与 后 的 势能 是 多 少 ， 或 者 合并 前 与 后 在 右 重 结 点 
数量 间 的 差别 有 多 大 ? 

首先 应 注意 ， 为 了 成 为 重 结 点 ， 结 点 必须 比 它 的 兄弟 结 点 有 更 多 的 子孙 。 因 此 ， 可 以 容 
易 地 明白 ， 在 任何 结 点 的 孩子 中 ， 最 多 有 一 个 是 重 的 。 基 于 上 面 的 陈述 ， 在 图 10-4 中 可 以 看 
到 连接 到 左 路 径 中 右 重 结 点 数 与 左 路 径 中 的 轻 结 点 数 相关 。 
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由 于 只 有 轻 结 点 的 兄弟 结 点 可 能 是 连接 到 左 路 径 的 重 结 点 ， 连 接 到 左 路 径 的 右 重 结 点 数 
总 是 小 于 或 等 于 儿 堆 左 路 径 重 轻 结 点 数 。 现 在 。 可 能 的 轻 结 点 
的 问题 是 估计 路 径 中 轻 结 点 数 。 

为 了 估计 路 径 中 的 轻 结 点 数 ， 要 注意 ， 如 
果 x 是 一 个 轻 结 点 ， 那 么 x 的 权 值 一 定 小 于 或 等 
于 其 父 结 点 p(x) 的 一 半 。 如 果 y 是 x 的 子孙 ， 且 y 
是 轻 结 点 ， 那 么 y 的 权 值 一 定 小 于 或 等 于 p(x) 权 
值 的 四 分 之 一 。 换 句 话 说 ， 考 虑 从 结 点 x 到 y 的 
路 径 中 的 轻 结 点 序列 ， 容 易 看 到 这 些 轻 结 点 的 
权 值 快速 地 减少 ， 而 且 ， 对 针 堆 的 任何 路 径 ， 





可 能 的 右 重 结 点 


此 路 径 中 的 轻 结 点 数 一 定 小 于 [logn]. KR 图 10-4 可 能 的 轻 结 点 和 重 结 点 
味 着 关联 到 左 路 和 从 的 右 重 结 点 数 一 定 小 
于 [Jog,”}, 


注意 a; =6+ 名 一 1， 其 中 是 操作 OP; 的 耗 时 ， 办 表示 操作 OP 之 后 的 势能 。 

tf; 的 值 与 右 路 径 的 长 度 有 关 ， 参 见 图 10-5， 令 kK,(K,) 是 在 hi(h,) 中 右 路 径 的 重 结 点 数 ， 
n(n2) 是 hi(h,) 中 的 结 点 数 ， Li(L) 等 于 hh1(h,) 中 右 路 径 上 的 轻 结 点 数 加 重 结 点 数 。 FH, ¢ AS 
于 2 + 上 + 上 合并 路 径 上 的 结 点 数 确定 。( 其 中 的 2 是 指 h, 和 有 ,的 根 。) 


轻 结 点 数 轻 结 点 数 
< Log2 n] < log, nj < liog， n, | < losg。 n| 
重 结 点 数 = ki 重 结 点 数 = 





H: h, H: h, 
结 点 数 : n 结 点 数 : m 


图 10-5 两 标 斜 堆 
所 以 ，6 = 24+, +L, 
=2+ 凡 右 路 径 中 的 轻 结 点 数 
+ AEP MBE ARK 
+ hh 有 路 径 中 的 轻 结 点 数 
+ hs 右 路 径 中 的 重 结 点 数 
<2 + [log, n |+ K, +|log, a | + K, 
<2 + 2 |log,n|+ K, + Kp, 
其 中 n =n, +m, 
现在 计算 a; 的 值 。 在 合并 之 后 ， 右 路 径 中 的 KK + 天 ?个 右 重 结 点 消失 了 ， 而 产生 了 小 
于 [logsn| 关 联 到 左 路径 的 右 重 结 点 。 所 以 
(a [108:7 |-K -K 对 于 i=1, 2, c, m 
那么 ， 得 到 
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a= ti + Pp) 
<2 +2 |log, n|+ K,+K,+ |log, ?| 一 一 大 
=2+3 | log, n| 


所 以 , a;= O(log, n), H>dt,/m= O(log, n). 
10.3 AVL 树 的 分 摊 分 析 


在 本 节 中 ， 将 对 AVL 树 进行 分 摊 分 析 。 如 果 每 个 结 点 的 子 树 高 度 差 至 多 是 1， 那 么 该 二 又 
树 是 一 哥 AVL 树 ， 图 10-6 显 示 一 棵 AVL 树 。 正 如 所 看 到 的 ， 每 个 结 点 的 子 树 高 度 差 至 多 是 1， 
在 这 种 定义 下 此 树 是 平衡 的 。 

对 于 以 V 为 根 的 子 树 T， 表 示 为 及 (了 T) 的 高 度 
定义 成 从 根 v 到 叶子 的 最 长 路 径 长 度 。 令 L(v) 
(R(v)) 是 以 "为 根 的 左 Of) 子 树 ， 那 么 对 于 
每 个 结 点 v， 定 义 其 高 度 平衡 因子 hb(v) 为 


hb(v) = H(R(v))-A(L(v)) 


对 于 一 棵 AVL 树 ，hb(v) 只 等 于 0，+1 或 -1。 
对 于 图 10-6 的 AVL 树 ， 一 些 结 点 的 高 度 平 





衡 因 子 如 下 : 图 10-6 一 棵 AVL 树 
hb(M) = 一 1 hb(D =—-1 
hb(E) =0 hb(C) =0 
hb(B) =0 hb(O) = +1 


由 于 AVL 树 是 二 又 树 ， 要 往 树 中 增添 一 项 ， 那 么 该 新 的 数据 项 将 成 为 一 个 叶子 结 点 。 这 个 
叶子 结 点 会 导致 一 条 特殊 的 路 径 ， 其 上 所 有 结 点 的 平衡 因子 都 需 改变 。 图 10-7 显 示 了 图 10-6 中 
的 AVL 树 所 有 结 点 的 平衡 因子 。 增 添 一 项 4， 新 树 如 图 10-8 所 示 。 我 们 看 到 ， 新 树 不 再 是 一 樟 
AVL 树 ， 必 须要 调整 平衡 。 将 图 10-8 与 图 10-7 做 比较 ， 看 到 只 有 MM，1，E，C，B，A 这 条 路 径 
上 的 结 点 的 平衡 因子 需要 改变 。 





图 10-7 标记 高 度 平衡 因子 的 AVL 树 图 10-8 增添 4 的 新 AVL 树 
AV, 为 增添 到 AVL 树 中 的 新 叶子 结 点 ，Vo，Vi，…，Vi_1，Vi 是 刚 产 生 的 路 径 ， 其 中 Vo 是 
根 。 在 插入 前 ， 令 i 是 使 得 hb(V;) = jp(V = … = hb(Vi_1) = 0 最 小 的 1。 如 果 i 之 1， 那么 结 点 
V | 称 为 该 路 径 的 关键 结 点 (critical node)，Vi，…，WVi_1 称 为 由 Vi 产生 的 关键 路 径 (critical 


path) 。 
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参见 图 10-7， 如 果 新 插入 的 结 点 连接 到 8， 那 么 关键 路 径 是 E，C，B。 将 图 10-7 与 图 10-8 
比较 ,注意 到 结 点 E，C，B8 的 平衡 因子 都 从 0 改变 为 -1。 假 设 增添 一 个 新 结 点 到 结 点 R 的 右 分 
文 ， 那 么 8 和 R 的 平衡 因子 从 0 改变 为 +1。 

令 Tl 是 一 棵 空 AVL 树 ， 邯 虚 向 To 进行 m 次 插入 的 操作 序列 。 令 X, 表 示 在 这 m 次 插入 过 程 中 ， 
平衡 因子 从 0 改变 为 +1 或 一 1 的 总 次 数 。 现 在 的 问题 是 找 出 X,。 下 面 的 分 摊 分 析 将 证 明 X, 小 于 
或 等 于 2.618m， 其 中 mm 是 在 AVL 树 中 数据 元 素 的 数量 。 

令 L 表 示 涉 及 第 i 次 插入 操作 的 关键 路 径 长 度 ， 那 么 


X= DE 


下 面 证 明 ， 当 一 个 新 元 素 播 和 时， 可 能 有 三 种 情况 : 

情况 1， 不 需要 平衡 调整 。 树 的 高 度 不 增长 ， 只 “吸收 ”该 结 点 而 形成 新 树 。 

情况 2: 需要 平衡 调整 。 需 要 进行 二 次 或 一 次 旋转 产生 新 的 平衡 树 。 

WAS: 不 需要 调整 。 但 树 的 高 度 增加 了 ， 只 需 在 树 的 高 度 上 记录 该 增加 。 

在 说 明 这 三 种 情况 之 前 ， 令 Yal( 了 表示 树 T 中 不 平衡 结 点 数 ， 也 就 是 Val( 了 等 于 平衡 因子 不 
为 0 的 结 点 数 。 

情况 1， 考虑 图 10-9， 虚 线 表示 插入 新 数据 项 。 由 于 插入 后 仍然 是 AVL 树 ， 不 需要 做 平衡 
调整 。 先 前 的 树 只 简单 地 吸收 该 新 结 点 ， 树 的 高 度 也 没有 改变 。 在 这 种 情况 下 ， 在 关键 路 径 
上 所 有 结 点 的 高 度 平衡 因子 的 改变 是 从 0 到 一 1 或 十 1。 从 而 ， 关 键 结 点 的 平衡 因子 的 改变 将 从 
二 1 或 -1 到 0。 因 此 ， 

Val(T,) = Val(T, ,) + (L; — 1) 

情况 2， 参见 图 10-10， 在 这 种 情况 下 ， 需 要 调整 平衡 树 。 





Co 
© (0) 
© ORORO 
O00 © 
图 10-9 插入 后 的 情况 1 图 10-10 插入 后 的 情况 2 


需要 某 种 两 次 和 一 次 的 旋转 。 对 二 如 图 10-10 所 示 的 情况 ， 其 平衡 树 如 图 10-11 所 示 。 很 容 
易 看 到 关键 结 点 M 的 平衡 因子 从 -1 改变 为 0。 
但 必须 改变 关键 路 径 上 所 有 结 点 的 平衡 因子 从 
0 到 +1 或 -1， 除 了 在 关键 路 径 中 关键 结 点 的 孩 (m) 
子 ， 在 调整 后 它们 也 是 平衡 的 。 因 此 ， 在 这 种 S O (x) (0) 
tii F, Val(T,) = VaT, i) + (L;-2). 


情况 3: 参见 图 10-12， 在 这 种 情况 下 ， 不 (a) Q DA O 


需要 调整 平衡 此 树 ， 但 树 的 高 度 将 会 增加 。 图 10-11 图 10-10 的 平衡 树 
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容易 看 出 
Val(T,) = Val(T,_,) + L; GA) 
AEX BEATEN LP HG CIEE AN, XS PEAR CEL O 
2 中 需要 一 次 旋转 的 次 数 ，X 表 示 在 情况 2 中 需要 两 次 旋转 /9 
的 次 数 ，X; 表 示 在 情况 3 中 增加 的 高 度数 ， 那么, 利用 上 面 (a) 
三 种 情况 描述 的 公式 ， 得 到 
m 图 10-12 插入 后 的 情况 3 
Val(T,) = Val(Ty) + DL; —X—2(Xs + X,) 


在 上 面 的 式 子 中 ， 一 X; 和 一 2(X; + X) 分 别 对 应 情况 1 和 情况 2。 D L EL, A LE 
有 三 个 式 子 中 。 i= 


由 于 De =X,, ValT,) =0， 又 因为 X,+ XX + XX + XX =m， 所 以 可 得 


X, = Val(T,,) + X,+ 2(X; + X4) 
= Val(T,) + (X, + X; + X,+ Xs) + (X; + X,—X;) 
= Val(T,,) + m +(X, + X,—X;) 
现在 ， 显然 X， + Xa <m, X; 20, 所 以 ， 
X, <Val(T,,) +m+m 
= Val(T,,) + 2m 
这 在 Knuth 的 《计算 机 程序 设计 艺术 》 第 3 卷 中 已 证 明 
Val(T,,) <0.618m 
因此 ， 可 得 


X,<Val(T,,) + 2m 
= 2.618m 


10.4 自 组 织 顺序 检索 启发 式 方法 的 分 摊 分 析 


顺序 检索 (sequential search) 是 最 简单 的 一 种 检索 方法 ， 有 许多 提高 顺序 检索 性 能 的 方 
法 ， 其 中 之 一 称 为 自 组 织 方法 (self-organizing method), 

想象 一 栋 学 生 宿 舍 ， 有 几 个 相当 受 欢迎 的 学 生 ， 他 们 不 停 地 接收 电话 。 如 果 足 够 聪明 的 
话 ， 接 线 员 会 将 这 些 学 生 的 房间 号 列 在 表 前 ， 这 样 ， 会 很 快 地 回应 电话 。 

自 组 织 方法 利用 了 这 种 思想 ， 动 态 地 向 前 移动 频繁 检索 的 项 。 也 就 是 在 任意 检索 完成 后 ， 
将 该 项 向 前 移动 。 有 三 种 有 名 的 自 组 织 方法 : 

(1) 交换 方法 (transpose method); 当 查找 到 某 项 ， 将 它 与 其 前 一 项 交换 。 因 此 ， 该 方法 
向 表 的 最 前 端 移动 一 个 位 置 。 

(2) 移 前 方法 (move-to-the-front method); 当 查 找到 某 项 ， 移 动 该 项 到 表 的 最 前 端 。 

(3) 计数 方法 (count method); 当 查找 到 某 项 ， 增 加 该 项 的 计数 ， 向 前 移动 保持 存储 表 的 
递减 次 序 。 

习惯 上 称 上 述 这 些 方法 为 启发 式 方法 (heuristic method) 。 所 以 ， 这 三 种 方法 也 分 别称 为 
交换 启发 式 方法 (transpose heuristics)， 移 前 启发 式 方法 (move-to-the-front heuristics) 和 计 
数 启 发 式 方法 (count heuristics ) 。 
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接 下 来 ， 将 通过 几 个 例子 说 明 这 些 启 发 式 方法 。 我 们 总 是 假定 以 空 表 开始 。 


(1) 交换 启发 式 方法 ( 见 表 10-2)。 
(2) 移 前 启发 式 方法 ( 见 表 10-3)。 


表 10-2 交换 启发 式 方法 


10-3 移 前 启发 式 方法 





查询 序列 查询 序列 
B B B B 

DB D DB 
A DAB A ADB 
D DAB D DAB 
D DAB D DAB 
C DACB C CDAB 
A ADCB A ACDB 


(3) 计数 启发 式 方法 ( 见 表 10-4)。 

现在 关注 这 些 不 同 启 发 式 方法 的 分 摊 分 
析 。 已 知 查询 序列 $， 在 启发 式 方法 R 下 ， 查 询 
序列 5 的 代价 定义 为 该 序列 在 这 个 启发 式 方法 R 
下 ， 依 次 检索 需要 比较 的 总 次 数 ， 将 其 表示 为 
Ca (S$)。 假 如 有 m 次 查询 ， 如 果 能 找到 关于 m 的 
函数 作为 其 代价 这 是 最 好 的 。 正 如 以 前 所 做 的 ， 
变 为 找 出 此 代价 的 上 界 。 如 果 此 序列 数据 项 已 
优化 为 静态 次 序 ， 那 么 此 上 界 与 该 代价 相关 。 
当 对 于 序列 $ 数 据 项 的 次 序 已 静态 优化 ， 那 么 
其 代价 标记 为 Co (8)。 例 如 ， 假 如 有 两 个 查询 


表 10-4 计数 启发 式 方法 





查询 序列 

B B 

D BD 

A BDA 
D DBA 
D DBA 
A DAB 
C DABC 
A DABC 


序列 ， 令 查询 8 的 次 数 高 于 查询 4 的 次 数 ， 那 么 对 此 查询 序列 的 优化 静态 序列 为 B A. 

在 本 节 的 剩余 部 分 中 ， 将 对 Cn (5) 与 Co (5) 进 行 比较 。 比 较 这 两 个 代价 将 基于 一 些 启发 式 方 
法 具有 的 一 个 非常 重要 的 属性 ， 称 为 两 两 独立 属性 (pairwise independent property)。 在 介绍 
该 属性 前 ， 定 义 字 内 比较 (intraword comparison) 为 在 不 同 的 数据 项 间 的 比较 ， 因 此 ， 字 内 
比较 是 一 种 不 成 功 的 比较 。 字 间 比 较 表 10-5 查询 序列 C A C BC A 的 移 前 启发 式 方法 


(interword comparison) 是 在 相似 的 数据 项 
间 做 的 比较 ， 是 一 种 成 功 的 比较 。 现 在 介绍 
两 两 独立 属性 。 

考虑 移 前 启发 式 方法 。 有 下 面 的 查询 序 
列 : C 4 C BC A, 该 序列 现在 表 10-5 中 。 

接 下 来 ， 将 注意 力 集中 在 对 4 与 B 间 的 比 
较 ， 上 面 的 分 析 表 示 对 于 该 序列 ， 在 A 与 B 
间 的 比较 总 次 数 是 2。 

假定 只 考虑 由 4 和 8 组 成 的 子 序列 ， 参 见 
表 10-6。 在 4 和 8B 间 的 比较 总 次 数 仍 是 2， 这 
与 表 10-5 一 样 。 

换 名 话说， 对 于 移 前 启发 式 方 法 ， 任 何 
一 对 数据 项 P 和 0Q 之 间 的 比较 总 次 数 只 依赖 


查询 序列 (A, B) 比较 
C C 

A AC 

C C 4 

B BCA v 

c CBA 

A 


ACB Vv 


表 10-6 查询 序列 A B A 的 移 前 启发 式 方法 


查询 序列 (A. B) 比较 
A A 
B BA v 


A AB vV 
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于 P 和 Q 在 查询 序列 中 的 相对 次 序 ， 这 独立 于 其 他 项 。 也 就 是 说 ， 对 任何 序列 S 及 所 有 的 P 与 8 
对 ，P 与 8 字 内 比较 的 总 次 数 就 是 对 只 由 P 和 Q 构 成 的 子 序列 S 所 作 的 字 内 比较 次 数 ， 此 属性 称 
为 两 两 独立 属性 。 

例如 ， 再 次 考虑 查询 序列 C A C B C 4。 有 三 个 不 同 的 字 内 比较 : (4，B)，(4，C) 和 (B， 
C)。 可 以 单独 考虑 它们 ， 并 将 它们 加 起 来 ， 如 表 10-7 所 示 。 

字 内 比较 的 总 次 数 等 于 0 + 1 + 1 +2+1+2=7, 很 容易 检查 这 是 对 的 。 

令 Cu(5) 表 示 移 前 启发 式 方法 的 代价 。 接 表 10-7 移 前 启发 式 方法 的 字 内 比较 次 数 
下 来 ， 将 证 明 Cw (S)<2C,(S), MAG, H We A ci caeca 
任何 查询 序列 ， 移 前 启发 式 方法 的 代价 不 会 超 


过 优化 静态 查询 序列 代价 的 两 倍 。 ora ele 
首先 由 两 个 不 同 的 数据 项 组 成 的 证 明 0 oft (0 
Cu (S)<2Co(S), SSHa AMDT BAM, HK 0 1 12 1 2 


中 a<b。 所 以 ， 优 化 静态 次 序 为 B 4。 如 果 使 

用 移 前 启发 式 方法 ， 那 么 总 的 字 内 比较 次 数 就 是 从 B 4 到 4 B 的 改变 数 加 上 从 4 BAB 4 的 改 
变数 。 因 此 ， 该 数 不 会 超过 2a。 令 Intraw (5) 和 Inirao (5) 分 别 表示 在 移 前 启发 式 方法 下 和 优化 
静态 次 序 下 字 内 比较 的 总 次 数 。 对 于 任意 由 两 个 不 同 的 数据 项 组 成 的 8 可 得 


Intray(S)<2Intrag (S) 
考虑 由 多 于 两 个 数据 项 组 成 的 任意 序列 9$。 由 于 移 前 启发 式 方法 具有 两 两 独立 属性 ， 易 得 
Intra, (S) & 2Intra, (S) 


Q Intray (S)AUntrag (5) 分 别 表示 在 移 前 启发 式 方法 下 和 优化 静态 次 序 下 字 间 比较 的 总 次 
数 。 易 得 


Inter,,(S) = Inter (S) 
所 以 ， 


Inter „ (S) + Intra (S$) Inter, (S) + 2Intrao (S) 

Cu(S)<2Co0(5) 

人 们 也 许 想 知道 系数 2 是 否 可 进一步 紧 致 ， 下 面 将 证 明 这 是 不 可 能 进行 的 。 

考虑 查询 序列 S = (4 BC D)"， 该 序列 的 优化 静态 序列 为 4B C D， 其 总 的 比较 次 数 Co(5) 为 





1+2+3+4+1+2+3+4+-… 
| | -10. 知 -lom 
| 4 
4m 
在 移 前 启发 式 方法 下 ， 总 的 比较 次 数 Cy ORENT: 
Cu($S)=1 A A 
+2 B BA 
+3 C CBA 
+4 D DCBA 
+4 A ADCB 
B BADC 


+4 


10 + 4(4(m—1)) 
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所 以 ，Cw(S) = 10 + 4(4(m—1)) = 10 + 16m—16 = 16m 一 6。 
如 果 从 4 到 k 增 加 不 同 的 项 数 ， 可 得 
KK+D), mk+ Dk 








Col5) = 5 5 
和 Cy(S) = ED s kem- = EP em) o 
因此 ， 
Cy(S) _ Ss 2 +R (m-D 
C,(S) em 


1 k m-1 
m RD m |? 由 于 fw 及 中 
这 意味 着 系数 2 不 能 进一步 紧 致 了 。 
上 面 的 讨论 表明 移 前 启发 式 方法 最 坏 情 况 的 代价 是 2 Co (5)。 当 认为 Ce (5) 是 计数 启发 式 方 
法 的 代价 时 ， 使 用 同 祥 的 推导 可 以 证 明 C- (S) <2C, (5)。 遗 憾 的 是 ， 交 换 启发 式 方法 不 具有 两 
两 独立 属性 。 所 以 ， 对 于 交换 启发 式 方法 的 代价 没有 类 似 的 上 界 。 交 换 启 发 式 方法 不 具有 两 
CBC 4 来 加 以 说 明 。 ee 
对 于 交换 启发 式 方法 ， 如 果 独 立 考虑 不 同 查询 序列 C A C BC A 


项 的 对 ， 如 表 10-8 所 示 的 表示 情形 。 0 ! 1 (A,B) 

由 于 这 样 的 计算 ， 字 内 比较 的 总 数 为 1 + o ! k | ， ! eo 
1+2+1+2=7。 但 这 是 不 对 的 ， 正 确 的 字 内 O ltd...” 
比较 次 数 确定 如 下 : 

查询 序列 C A C B C A 

数据 次 序 C AC CA CBA CBA CAB 

字 内 比较 数 ”0 1 1 2 0 2 


确切 的 字 内 比较 次 数 应 为 1 + 1 + 2 + 2 = 6。 这 表明 两 两 独立 属性 对 于 交换 启发 式 方法 不 
成 立 。 
10.5 配对 堆 及 其 分 摊 分 析 
在 本 节 中 将 介绍 配对 堆 (pairing heap) 及 (5) 
完成 对 该 数据 结构 的 分 摊 分 析 。 很 显然 ， 配 对 


堆 可 以 简化 成 这 样 的 一 个 扩展 ， 它 使 得 从 配对 OC CO wO s 
堆 中 删除 最 小 元 素 变 得 困难 。 尽 管 如 此 ， 在 配 


对 恶化 到 如 此 精 糕 之后， 分 摊 分 析 也 能 证 明 它 
能 很 快 地 恢复 。 (8) © GG) 9 


图 10-13 显 示 一 个 典型 的 配对 堆 。 在 介绍 
删除 最 小 元 素 操作 之 后 ， 将 解释 为 什么 称 其 为 Gn) 
配对 堆 。 
注意 ， 如 同 在 任何 堆 中 一 样 ， 一 个 结 点 的 图 10-13 一 棵 配对 堆 
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父 结 点 的 关键 字 小 于 该 结 点 本 身 。 当 然 应 使 用 一 种 良 结构 的 数据 结构 来 实现 配对 堆 。 对 于 配 
对 堆 ， 采 用 二 叉 树 技术 。 图 10-13 中 的 配对 堆 的 二 叉 树 
表示 在 图 10-14 中 。 如 图 10-14 中 所 示 ， 如 果 有 的 话 ， (s) 
每 个 结 点 都 关联 到 其 最 左 后 代 和 下 一 个 右 兄弟 。 如 图 © 
10-13 中 ， 结 点 7 将 结 点 8 作为 其 最 左 后 代 ， 结 点 10 作 为 Q. 
其 下 一 个 右 兄弟 。 因 此 ， 在 二 又 树 表示 中 ， 结 点 7 与 结 (8) O 
点 8 和 结 点 10 关 联 ， 如 图 10-14 所 示 。 
配对 堆 有 七 种 基本 的 操作 ， 它 们 是 21) (3) (6) (1s) 
(1) make heap(h): Btr—4- 4 HAW RAH. 
(2) find min(h): 找 出 配对 堆 h 的 最 小 者 。 (25) 
(3) insert(x, A): 向 配对 堆 h 中 插入 元 素 x。 (20) 
(4) delete min(h); 从 配对 堆 jp 中 删除 最 小 元 素 。 图 10-14 图 10-13 中 配对 堆 的 二 又 树 表示 
(5) meld(h,, h): 合并 两 个 配对 堆 h 和 h, 为 新 堆 。 
(6) decrease key(A, x, h): 将 配对 堆 h 中 的 元 素 x 减少 A 大 小 。 
(7) delete(x, h): 从 配对 堆 h 中 删除 元 素 x。 
另 一 个 基本 的 内 部 操作 称 为 link(h,，h,)， 将 两 个 配对 堆 连 接 为 一 个 新 堆 ， 可 以 证 明 上 面 
提 到 的 许多 操作 都 基于 该 连接 操作 。 图 10-15 说 明了 一 个 典型 的 连接 操作 。 


be ihe 


图 10-15 操作 link(h,，h) 的 例子 


现在 举例 说 明 在 配对 堆 中 这 七 个 操作 是 如 何 实现 的 。 

(1) make heap(h); 仅 给 新 堆 分 配 一 个 空 内 存 位 置 。 

(2) find min(h): 简单 返回 堆 的 根 结 点 。 

(3) insert(x, h): 该 操作 由 两 步 组 成 ， 首 先生 成 只 有 一 个 结 点 的 树 ， 再 将 其 与 配对 堆 h 连 
接 。 图 10-16 和 图 10-17 显 示 了 这 两 步 。 


; © 
-一 人 


图 10-16 插入 示例 
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中 (i) 
(is) (20) ime, QS) 
OO (is) (21) 

(29) (37) 


图 10-17 另 一 插入 示例 
(4) meld(h,，h,): 简单 地 返回 通过 连接 如 和 有 ,形成 的 
新 堆 。 (5) 
(5) decrease(A, x, h): 该 操作 由 三 步 组 成 。 
HR: 从 元 素 x 中 减 去 A。 
步骤 2: 如 果 x 是 根 ， 那 么 返回 。 Q (9) © 
步骤 3 : 剪断 x 到 父 结 点 的 连接 ， 这 将 生成 两 标 树 ， 连 


接 这 两 棵 树 。 
考虑 操作 decrease(3，9，h)， 其 中 有 如 图 10-18 所 示 。 © © 
图 10-19 说 明 该 操作 是 如 何 实现 的 。 图 10-18 说 明 decrease 操 作 的 配对 堆 





图 10-19 对 图 10-18 中 的 配对 堆 实 施 decrease(3，9， 月 操作 


(6) delete(x, h): 此 操作 有 两 步 。 
步骤 1， 如 果 x 是 根 ， 那 么 返回 (delete min(h)). 
步骤 2: 否则 ， 
BR, 剪断 x 到 父 结 点 的 连接 。 
步骤 2.2: 在 根 为 xz 的 树 上 实现 delete min(h) 操 作 。 
步骤 2.3， 连接 生成 的 树 。 
注意 ， 在 delete(xz， 月 内 部 有 还 未 描述 的 delete min( 有 ) 操 作 。 因 为 该 操作 对 于 配对 堆 的 分 摊 
分 析 是 非常 重要 的 ， 所 以 我 们 有 意 推迟 对 该 操作 的 讨论 。 实 际 上 ， 从 分 摊 分 析 意 义 上 ，delete 
min(h) 操 作 使 得 配对 堆 成 为 一 个 优美 的 数据 结构 。 
在 描述 delete min( 有 操作 前 ， 考 虑 图 10-20 中 的 配对 堆 ， 图 10-21 是 该 配对 堆 的 二 又 树 表示 。 
如 图 10-21 所 示 ， 该 二 又 树 严重 地 向 右倾 斜 。 
在 删除 堆 的 最 小 元 素 ， 也 就 是 二 又 树 的 根 之 后 ， 需 要 重 构 该 堆 。 该 重 构 必须 执行 一 个 函 
数 ， 找 出 堆 的 第 二 层 元 素 的 最 小 者 。 相 对 于 二 又 树 表示 ， 第 二 层 元 素 都 在 图 10-21 中 一 条 路 径 
中 。 如 果 堆 的 第 二 层 有 许多 元 素 ， 那 么 对 应 的 路 径 将 相当 长 。 在 此 情形 下 ， 找 出 最 小 元 素 的 
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操作 将 花费 相当 长 的 时 间 ， 这 是 不 希望 出 现 的 。 








图 10-20 说 明 delete min(h) 操 作 的 配对 堆 图 10-21 图 10-20 中 配对 堆 的 二 又 树 表 示 


我 们 将 以 很 高 的 概率 论证 堆 中 第 二 层 的 元 素数 目 是 很 少 的 。 换 句 话说 ， 对 应 的 二 又 树 将 
是 非常 平衡 的 。 


再 次 考虑 图 10-20 中 的 配对 堆 。delete min(h) 操 作 首 先前 断 与 堆 的 根 的 所 有 连接 ， 这 将 生 
成 七 个 堆 ， 如 图 10-22 所 示 。 


在 delete min(h) 操 作 的 这 一 步 ， 成 对 地 合并 生成 的 堆 ， 第 一 个 与 第 二 个 ， 第 三 个 与 第 四 个 
等 。 如 图 10-23 所 示 。 


2121031 


图 10-22 delete min( 甩 操作 的 第 一 步 图 10-23 delete min( 及 操作 的 第 二 步 


在 成 对 合并 操作 之 后 ， 再 一 个 接 一 个 地 连接 这 些 配 对 堆 到 最 后 一 个 堆 上 ， 从 倒数 第 二 个 
堆 开始 ， 然 后 是 倒数 第 三 个 堆 ， 依 此 类 推 ， 如 图 10-24 所 示 。 


RT © 

AA A @ A 

AA cs) A 
A 


a) 
Æ 10-24 delete min(h) 操 作 的 第 三 步 





268 #10% 











(3) (6) 
AM A 
人 (is) A 

/A 





link 
一 一 


b) 





图 10-24 (48) 


所 有 delete min(h) 操 作 的 三 步 都 可 以 在 堆 的 二 叉 树 表示 上 直接 实现 。 

图 10-24 中 生成 的 堆 的 二 叉 树 表示 如 图 10-25 所 示 。 显 然 ， 该 二 又 树 比 图 10-21 所 示 的 更 加 

在 说 明了 delete min( 和 操作 之 后 ， 说 明 delete(x， 站 操作 。 考 虑 图 10-26 中 的 配对 推 。 如 果 
x=6， 那 么 删除 它 之 后 ， 得 到 图 10-27 所 显示 的 堆 。 





图 10-25 图 10-24 中 生成 的 堆 的 二 又 树 表示 图 10-26 说 明 delete(x， 有 操作 的 配对 堆 
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图 10-27 从 图 10-26 中 的 配对 堆 删除 6 后 的 结果 


现在 将 对 配对 堆 的 操作 给 出 分 梭 分 析 。 如 前 所 述 ， 首 先 定义 一 个 势能 函数 。 

已 知 二 叉 树 的 一 个 结 点 x， 令 s(9) 表 示 包 含 x 的 子 树 中 的 结 点 数 。 结 点 x 的 秩 表示 为 rt)， 定 
义 为 log(s(x))。 一 棵 树 的 势能 是 所 有 结 点 秩 的 和 。 

例如 ， 图 10-28 显 示 了 两 棵 树 的 各 自 势能 。 





¢=log 5 + log 3 + 3 log l = log 15 





图 10-28 两 棵 二 又 树 的 势能 


在 七 个 配对 堆 的 操作 中 ， 建 堆 (make heap) 和 找 最 小 元 素 (find minimum) 操作 对 势能 
不 产生 任何 改变 。 揪 入 (insert) 、 合 并 (meld) 和 减 量 (decrease) 操作 很 容易 明白 势能 的 改 
变 至 多 是 log(n+ 1)， 这 是 由 内 部 的 连接 操作 产生 的 。 对 于 删除 (delete) 和 删除 最 小 元 素 
(delete minimum) 操作 ， 关 键 的 操作 是 删除 最 小 元 素 操作 。 使 用 一 个 例子 来 说 明 势 能 的 改变 。 
考虑 图 10-29， 在 图 10-29a 中 配对 堆 的 二 叉 树 如 图 10-29b 所 示 。 
Arr. ty. 1 和 ry 分 别 表示 结 点 4、B、C 和 D 的 秩 ， 结 点 4、B、C 和 D 的 结 点 总 数 分 别 为 5。、 
S 、8. 和 3$, ， 那 么 ， 图 10-29b 中 二 又 树 的 势能 是 
P=r,+r,t+r. +rst+log(S, + S,+ Sc+ Sy+ 5) 
+ log(S, +S, + S, + Ss+4)+1log(S, + S.+ Sg +3) 
+ log(S. + Sy + 2)+ log(S, + 1) 
在 删除 最 小 元 素 1 后 ， 配 对 堆 操 作 序 列 将 如 图 10-30a~c 所 示 。 最 后 的 配对 堆 表示 在 图 
10-30c 中 ， 其 二 叉 树 表示 在 图 10-30d 中 。 
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(1) S$, =S, tSp +5, +Sy+5=n 
(4) $,=5,+5,+S,+5,+4 

/A\ (3) S,=5,+5,+5443 

(2) S)=S, +8442 








图 10-29 一 个 堆 和 它 的 说 明 势 能 改变 的 二 又 树 


Oe A 


bee 





图 10-30 删除 图 10-29 中 最 小 元 素 的 配对 堆 序 列 及 其 最 终 堆 的 二 又 树 表示 
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@i=r,tr,tr,. +r, + log(S, + S, + 1) + log(S, + 5,4 1) 
+ log(S, + S, + S. + S, + 3) + log(n—1) 
=r, tr,tr.+r,+ log(S, + S, + 1) + log(S. + 5,+ 1) 
+ log(S, + S, + S. + Su + 3) + log(S, + 5,+8,+5,+4) 
总 之 ， 设 有 操作 序列 OP,，OP,，…，OP,， 每 种 操作 OP, 是 配对 堆 的 七 个 操作 之 一 。 令 
a, =1,+%-¢ ,， 其 中 办 和 少 -分 别 表 示 操 作 OP; 之 后 和 之 前 的 势能 ，# 是 完成 操作 OP, 所 需 的 
时 间 。 接 下 来 ， 将 集中 注意 力 在 删除 最 小 元 素 (delete minimum) 操作 上 ， 推 导出 该 操作 的 分 
摊 上 界 。 显 然 ， 所 有 其 他 操作 都 具有 同样 的 上 界 。 
注意 ， 删 除 最 小 元 素 操作 由 下 面 的 操作 组 成 ， 
(1) 删除 根 。 
(2) 配对 合并 。 
(3) 一 个 接 一 个 地 与 最 后 堆 合 并 。 
对 第 一 个 操作 ， 显 然 势 能 的 最 大 变化 是 A 由 = —log n。 
接着 考虑 配对 合并 。 最 初 ， 二 又 树 有 一 串 结 点 ， 如 图 10-31 所 示 。 
重 画图 10-31， 如 图 10-32 所 示 。 


S,,=5,+5,+5,+2 








S, S, 
T, Te 
图 10-31 配对 操作 图 10-32 图 10-31 的 重 画 


Arr, ry 和 r. 分 别 表示 结 点 4、B 和 C 的 秩 ， 结 点 4、B 和 C 的 结 点 总 数 分 别 表示 为 5。 、5 和 
5. ， 那 么 第 一 次 合并 前 的 势能 为 


Prejore = Ta + Fp +r, + log(S, + S, + S. +2) + log(S, +5, + 1) 


第 一 次 合并 操作 合并 两 个 堆 ， 如 图 10-33 所 示 。 依 赖 于 x, 和 y 之 间 的 关系 有 两 种 合并 的 可 
能 。 这 两 种 生成 堆 的 二 叉 树 表示 如 图 10-34 所 示 ， 对 于 两 种 可 能 的 二 又 树 表示 ， 再 加 入 其 他 部 
分 如 图 10-35 所 示 。 


a< ( x> GO) 
Sh SA 
A A 


图 10-33 第 一 次 合并 后 两 种 可 能 的 堆 
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图 10-35 第 一 次 合并 后 生成 的 二 又 树 
对 于 图 10-35 中 的 两 棵 二 叉 树 ， 其 势能 是 
afer = Tat Ty +r, + log(S, + S, +S, + 2) + log(S, +S, +1) 
因此 ， 势 能 的 改变 为 


A pairing = faper — ppejore 
= log(S, + S, + 1)—log(S, + 8. + 1) 
尽管 此 结果 参考 了 第 一 次 合并 ， 但是， 显然 Apiirins 也 指 一 般 的 配对 。 
BATE HAAG wiring <2108(S,) <2log(S,)—2, 其 中 5, 表 示 在 改变 前 根 为 x 的 子 树 总 的 结 点 数 。 
为 了 证 明 上 述 结论 ， 将 利用 下 面 的 事实 : 
inp, q>0, p+q<1, MAlog p + logq<—2, 
上 面 的 性 质 很 容易 证 明 。 现 在 ， 令 


__ 8, +S, +1 
P S, +S, +5, +2 
s, 
和 gg 45.42 
S,+8, +1 S 
2, log 一 一 一 一 |+log| 一 一 一 一 一 一 | <-2, thi 
那么 ， (Ass) os] 也 就 是 


log(S, + S, + 1)—log(S,)<2log(S, + S, + S. + 2)—2log(S, )—2 

但 是 ，log(S.) < log(S, +5,+ 1). 

所 以 ， 

log(S, + S, + 1)—log(S, + S. + 1)<2log(S, + S, + S. + 2)—2log(S,)—2 
因此 ， 可 以 得 到 
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AGpairing <2lOg(S, + Sp + S. + 2)—2log(S,)—2 
= 2log(S, )—2log(S,.)—2 

对 于 最 后 一 对 ，5. = 0。 在 此 情况 下 ， 

A dpairing < 2log(S, ) 


首先 注意 到 ， 确 实 满足 了 有 / 对 结 点 的 假定 。 如 果 有 27 +1 个 结 点 ， 那 么 最 后 一 个 结 点 不 与 
其 他 结 点 合并 ， 所 以 势能 没有 改变 。 配 对 合并 总 的 变化 是 


j-l 
Arotat pairing = > (BiA@pairing ) + (第 j HAA Pairing ) 


j- 
< > (2 log(S,,)—2 log(S,, , )-2) + 2 log(S。 ) 


= 2(log(S,, )—log(S,, ) + log(S,, )—log(S,,) + … 
—log(S,, )) + 2 log(S,, )-20 -1) 
=2 log(S,, 2-1) 
<2 log n—2j +2 
因此 ， 删 除 最 小 元 素 操作 的 第 二 步 ， 
Apiaipairing =2 log n-2j +2 (x,) 
最 后 ， 讨 论 最 后 一 步 。 这 一 步 是 在 上 面 配对 
操作 之 后 发 生 的 ， 它 一 个 接 一 个 与 最 后 的 堆 合 并 。 GS (a) 
在 图 10-36 中 说 明 由 配对 合并 形成 的 二 又 树 〈 对 于 


PAM, (BEX < y ) 。 A, AN GX 


最 后 一 对 配对 合并 如 图 10-37 所 示 ， 势 能 为 


nefore = ray +t rg, tTa, +g, + log(S,,, + Sp, + 1) 从 JAN (x) 


+ log(S,, + Ss, +1)+ log(S,, + Sg, +2) 


+10g(S ,+ Sg, +54, + Ss +4) Q) 
合并 之 后 ， 依 赖 于 x) <x, a, BE AN AN 
成 的 二 叉 树 或 者 像 图 10-38a 或 者 像 图 10-38b。 
由 于 新 势能 与 图 10-38a 和 图 10-38b 中 显示 的 图 10-36 配对 操作 之 后 的 二 又 树 


二 叉 树 相 同 ， 所 以 只 考虑 其 中 的 一 种 。 对 于 图 10-38a 中 的 二 又 树 ， 新 的 势能 为 
Paper = Taj tTa tTa + 7 +log(S,__, + Sg, + 1) + log(S,, + Ss, +1) 
+ log(S4 ， + Se ， + Sa, + Ss, +3) 
+ log(S, ,+ Sg, +S +55, +4) 
Ap = Paper 一 Prefore 
= log(S, , + Se ， 十 Sa, + Ss, +3)+ log(S,, + Ss, +2) 
Sa, + Sp,, +S, + Ss, +4 是 整 棵 树 的 总 结 点 数 ， Sa, + Ss, +2 是 最 后 二 叉 树 的 总 结 点 数 。 令 
由 x; y. A, 和 8B, 组 成 的 树 的 结 点 数 为 n; ， 那 么 子 树 中 的 结 点 数 是 n,，n，,，，…，n; 。 总 势能 的 
改变 是 


Arnica step = log(n, + ny + + nja login + ns +e + nj) 
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+log(n, + n; 十 … nj —1)—-log(n,; + n+ +n) 
+ + log(n,_, +n; —1)—log(n; ) 
<log(n—2)—log(n,) 
<log(n—1) 


=5 +5 +S +S, +4 
Xi Bj, "Ay 7 PB, * PA; 





S = Sp +8, +2 
aj BT A; 


Sp. Sa, 
rg r J 
j Aj 








图 10-38 在 删除 最 小 元 素 操作 的 第 三 步 中 一 对 子 树 的 合并 结果 
现在 可 以 明白 整个 删除 最 小 元 素 的 操作 ， 


a; =t, + Q — Qi- 
<2j+ 1—-log n + (2log n—2j + 2) + log(n—1) 
<2logn+3 
= O(log n) 


尽管 对 删除 最 小 元 素 的 操作 ，O(log n) 是 一 个 上 界 ， 很 容易 明白 这 也 是 所 有 其 他 操作 的 上 
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界 。 总 之 ， 可 以 断定 配 堆 操作 的 分 摊 时 间 是 O(log n). 
10.6 不 相交 集合 并 算法 的 分 摊 分 析 


在 本 节 中 ， 将 讨论 一 种 很 容易 实现 的 算法 。 对 它 的 分 摊 分 析 表 明 它 有 一 个 明显 的 几乎 线 
性 的 运行 时 间 。 在 合并 操作 下 ， 该 算法 解决 了 维护 不 相交 集合 的 合并 问题 。 更 精确 地 说 ， 该 
问题 在 不 相交 集合 中 执行 三 种 操作 : 生成 新 集合 (makeset) ; 确定 包含 已 知 元 素 的 集合 
(find) ， 合 并 两 个 集合 成 一 个 集合 (link )。 作 为 识别 集合 的 方法 ， 假 定 算法 在 每 个 集合 中 维 
护 一 个 任意 但 唯一 的 代表 元 素 ， 称 为 该 集合 的 典型 元 素 (canonical element) 。 现 在 阐明 三 个 
集合 操作 如 下 : 

(1) makeset(x): 生成 包含 单一 元 素 x 且 先前 不 存在 的 新 集合 。 

(2) find): 返回 包含 元 素 x 的 集合 的 典型 元 素 。 

(3) link(x，y): 形成 一 个 由 典型 元 素 分 别 是 x 和 y 的 两 集合 并 而 形成 的 新 集合 。 销 毁 原来 的 
两 个 集合 ， 为 新 集合 选择 并 返回 一 个 典型 元 素 。 此 操作 假定 xy。 


注意 没有 删除 操作 。 
为 解决 此 问题 ， 用 根 树 (rooted tree) 表 AN AN 
示 每 个 集合 。 树 的 结 点 是 集合 中 的 元 素 ， 而 典 O © a 


型 元 素 作 为 树 的 根 。 每 个 结 点 x 有 指向 其 父 结 

点 p(X) 的 指针 ， 根 结 点 的 指针 指向 自身 。 为 了 (x) G) Go) (2) 
执行 操作 makeset(xz) ， 定 义 P(xz) 就 是 zx。 为 了 执 (站 

行 find(x)， 沿 着 从 x 到 含有 x 的 树 根 的 指针 ， 并 (xs) 

返回 根 。 为 了 执行 link(x，y)， 定 义 p(Xx) 是 y， 


将 y 作 为 新 集合 的 典型 元 素 返 回 。 参 见 图 10-39， Ce) G) 
操作 find(x6) 将 返回 xi， 操作 link(x， Xs) 将 使 x， 图 10-39 集合 {Xi，，…，X7}》、 
指向 xg。 {Xs，Xo，Xi0} 和 {Xx} 的 表示 


该 朴素 算法 并 不 非常 有 效 ， 每 个 find 操 作 
在 最 坏 情 况 下 要 求 O(n) 时 间 ， 其 中 n 是 元 素 的 


总 数 (makeset 操 作 )。 通 过 对 该 算法 增添 两 个 Xs 6 
启发 式 方法 ， 可 极 大 地 提高 其 性 能 。 第 一 个 方 x —_+ 

法 称 为 路 径 压 缩 (path compression), ， 在 find %2 

操作 期 间 , 通过 向 树 根 移 近 结 点 来 改变 树 结构 : “! a pa es a es 

当 执行 find(z) 时 ， 在 定位 包含 x 的 树 根 r 后 ， 将 


从 x 到 r 路 径 上 的 每 个 结 点 直接 指向 r ( 见 图 图 10.40 MAk, ays aus kee tes KEA 
10-40)。 路 径 压 缩 增 加 了 单个 find 操 作 一 个 常 
数 因子 的 时 间 ， 但 为 后 续 的 find 操 作 节 省 了 足够 的 了 时间。 
第 二 种 称 为 按 秩 合 并 (union by rank) 的 启发 式 方法 保持 树 得 低 。 结 点 x 的 秩 表 示 为 
rank(x)， 定 义 如 下 : 
(1) 当 makeset(x) 操 作 执 行 时 ，rank(x) 赋 值 为 0。 
(2) 当 link 操 作 执 行 时 ， 令 x 和 y 是 两 个 根 结 点 ， 有 两 种 情况 : 
(a) 情况 1 rank(x) = rank(y)。 
在 此 情况 下 ， 使 x 指向 y，rank(y) 增 加 1 ， 返 回 y 为 典型 元 素 。( 见 图 10-41a)， 
不 改变 x 的 秩 。 ` 
(b) 情况 2: rank(x)<rank(y), 
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在 此 情况 下 ， 使 x 指向 y， 返 回 y 为 典型 元 素 。x 和 y 的 秩 保持 一 样 。( 见 图 10-41b)。 
(3) 当 路 径 压缩 启发 式 方法 执行 时 ， 没 有 秩 的 改变 。 


x > Y rank(y) 
| rank(x) | = rank(y) +1 
= rank(y) 
x 


rank(x) 不 变 

a) 相同 秩 的 根 
x > Y rank(y) 

rank(x) | ) = rank(y) 
< rank(y) 
x 

rank(x) 不 变 

b) 不 同 秩 的 根 


图 10-41 按 秩 合 并 
现在 证 明 一 些 如 上 定义 秩 的 有 趣 性 质 ， 这 些 性 质 在 分 析 算 法 性 能 时 是 很 有 用 的 。 
性 质 1， doe Rx FAp(x), Æ Arank(x)<rank(p(x)), 
根据 秩 启 发 式 方法 ， 由 于 合并 该 性 质 成 立 。 当 连接 两 棵 树 时 ， 新 树 的 根 具有 最 高 的 秩 。 
性 质 2，rank(x) 的 值 初始 是 0， 随 时 间 而 增长 ， 直 到 它 不 再 是 根 为 止 ， 随 后 rank(x) 值 不 再 
改变 。rak(p(cj) 的 值 是 个 非 递减 的 时 间 函 数 。 
注意 ， 由 于 x 要 初始 化 ， 它 的 秩 从 0 开始 。 只 要 x 保持 是 根 ， 它 的 秩 就 永 不 减少 。 一 旦 它 有 
父 结 点 ， 它 的 秩 就 不 再 改变 了 ， 因 为 路 径 压缩 启发 式 方法 不 能 抵消 秩 。 
考虑 图 10-42。 在 一 个 find 操 作 期 间 ， 假 如 这 是 算法 转换 的 一 条 路 径 。 由 于 性 质 1， 
rank(x,)<rank(x,)<-+-<rank(x, ) 


在 路 径 压缩 操作 之 后 ， 这 部 分 树 如 图 10-43 所 示 。 现 在 ，x,/ 有 一 个 新 父 结 点 x, ， 显 然 ， 此 
新 的 父 结 点 x, 比 x 先前 的 父 结 点 有 更 高 的 秩 。 随 后 ，x, 可 能 连接 到 某 个 具有 更 高 秩 的 结 点 。 所 
Uh, x 后 来 有 另 一 个 新 的 更 高 秩 的 父 结 点 是 可 能 的 。 这 就 是 rank(p(x)) 的 值 不 会 减少 的 原因 。 


rank(x,) < rank(x,) <…< rank(x,) 


¢ 
, 
, 
o 
F 
， 
; 
; 
i 
; 
; 
f” 
x x, x Kp 


图 10-42 find 操 作 路 径 图 10-43 在 路 径 压 缩 操作 后 图 10-42 中 find 操 作 的 路 径 


性 质 3: AR Axo et 的 结 点 数 至 少 Dak 
显然 树 在 初始 化 时 性 质 3 显然 是 成 立 的 。 现 在 假设 在 两 棵 树 连 接 前 性 质 3 成 立 。 令 两 棵 树 
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的 根 是 x 和 y， 如 果 rank(x)<rank(y)， 那 么 新 树 将 y 作 为 根 。y 的 秩 不 再 改变 ， 新 树 比 之 前 有 更 多 
的 结 点 。 因 此 ， 对 该 新 树 性 质 3 成 立 。 如 果 rank(x) = rank(y)， 那 么 新 树 至 少 有 2 + 20 = 
2 x 270k) = 2 个 结 点 。 但 是 ， 新 根 的 秩 是 rank(y) + 1。 所 以 ， 性 质 3 对 此 情形 也 成 立 。 

性 质 4: 对 任意 之 0， 秩 为 的 结 点 数 至 多 是 n/2:， 其 中 nn 是 元 素 的 个 数 。 

可 将 秩 为 上 的 结 点 作为 树 的 根 。 根 据 性 质 3 ， 该 树 至 少 有 和 闪 个 结 点 。 因 此 ， 有 不 超过 my/2 结 
点 具有 秩 k， 否 则 ， 可 能 超过 n 个 结 点 ， 这 是 不 可 能 的 。 

性 质 5: 最 高 秩 是 log2n。 

当 只 有 一 棵 树 时 ， 才 可 得 到 最 高 秩 。 在 此 情形 下 ， 如 性 质 3 表 明 2* <n, Alt, k<log,n, 

我 们 的 目标 是 分 析 三 种 集合 操作 混合 序列 的 运行 时 间 。 很 容易 看 到 操作 makeset(x) 和 
link(x，y) 可 在 常数 时 间 内 完成 。 所 以 ， 下 面 只 分 析 find 操 作 所 需 的 时 间 。 使 用 mm 表示 find 操 作 
的 次 数 ，n 表 示 元 素数 。 这 样 ，makeset 操 作 次 数 是 n，link 操 作 的 次 数 至 多 是 n 一 1， 并 且 m 之 n。 
因为 路 径 压缩 以 一 种 复杂 的 方式 改变 了 树 的 结构 ， 使 得 分 析 变 得 困难 。 然 而 ， 使 用 分 摊 分 析 ， 
可 以 得 到 实际 最 坏 情 况 的 界 为 O(ma(m，n))， 其 中 a(m，n) 是 阿 克 曼 函数 (Ackermann’s 
function) 的 逆 函 数 。 对 i，j 之 1， 阿 克 曼 函数 A(i, |) LMF: 

A0, jf) =2 对 于 />>1 

Ali, D= A(i~1, 2) 对 于 i 之 2 

Ali, j)=A(i-1, Ali, j-1) 对 于 i, j>2 

对 m，n 之 1， 阿 克 曼 函数 的 逆 a(m，n) 定 义 为 

alm, n) = min{i> 1 |AG,|m/n]) >log, n} 

4(i， 旋 最 重要 的 性 质 是 它 爆 炸 性 地 增长 。 可 以 验证 其 中 一 些 : 

A(l, 1)=2'=2 

4(1,，2)=22=4 

4(1，4 和 =24= 16 

A(2, 1)=A(1, 2)=4 

A(2, 2)=A(l, A(2, 1))= ACI, 4) = 16 

A(2, 3)=A(l, A(2, 2))= ACI, 16) =2'° 

A3, 1)= A(2, 2) = 16, 

XH, a(m, n)<3 HH m/n#--Hn<2" = 65 536 合 理 的 值 。 事 实 上， 对 所 有 现实 的 目标 ， 
a(m，1 站 是 不 超过 4 的 常数 。 最 后 ， 要 推导 六 次 find 操 作 总 的 运行 时 间 O(na(m， 和 如 ) 的 上 界 。 

在 正式 分 析 算 法 之 前 ， 先 简要 地 描述 分 析 的 基本 思想 。 分 析 由 下 面 的 步 又 组 成 ， 

(1) 对 于 树 的 每 个 结 点 ， 分 配 一 个 层次 i， 该 层次 与 秩 有 关 。 将 证 明 有 1,，2，…，alm， 
nm)+1 层 。 如 果 一 个 结 点 有 较 高 的 层 ， 那 么 表明 该 结 点 有 大 量 的 兄弟 ， 或 者 树 的 这 部 分 相当 扁 
平 。 对 i 层 ， 整 数 分 成 许多 块 (i， 让 ， 后 面 将 加 以 解释 。 

(2) 通过 一 些 机 制 ， 将 结 点 分 成 两 类 : 贷方 结 点 (credit node) 和 借方 结 点 (debit node), 
对 于 任意 路 径 ， 贷 方 结 点 至 多 是 一 个 常数 。 因 此 ， 如 果 路 径 很 长 ， 那 么 总 是 由 于 有 大 量 的 借 
方 结 点 。 反 之 ， 如 果 路 径 很 短 ， 儿 乎 都 是 贷方 结 点 。 

(3) find 操 作 总 的 时 间 花 费 是 被 find 操 作 转 换 的 贷方 结 点 数 与 借方 结 点 数 的 和 。 由 于 被 find 
操作 转换 的 贷方 结 点 数 有 常数 界 ， 所 以 ， 找 出 被 find 操 作 转 换 的 借方 结 点 数 的 上 界 是 非常 重 
要 的 。 

(4) 对 属于 块 (i， 放 的 借方 结 点 ， 如 果 它 被 find 操 作 算法 转换 过 D 一 1 次 ， 其 中 b; 将 在 后 面 
解释 ， 结 点 的 层 将 增加 到 i + 1。 
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(5) 令 n, 表示 在 块 (i, 四 中 的 借方 结 点 数 。 值 n (b, 一 1) 是 被 find 操 作 转 换 借方 结 点 所 花费 的 
时 间 单 位 ， 这 将 提高 在 块 (、 放 中 的 所 有 结 点 层次 到 it 1。 
atm,n)+l 

(6) 由 于 最 高 层 是 a(m，n)+1， > D n (by -了 是 被 这 wm 次 find 操 作 转换 的 借方 结 点 总 数 
的 上 界 。 

从 定义 层 开始 ， 再 先 回顾 一 下 阿 克 曼 函数 。 本 质 上 阿 克 曼 函数 将 整数 分 为 不 同 层次 的 块 ， 
再 重 写 阿 克 曙 函数 : 

A(l, ) = 2/ 对 于 />1 

A(i, 1)= A(i-1, 2) et Fi>2 

Ali, j= AG~-1, AG, j-D) 对 于 i, j>2 

我 们 将 使 用 上 面 的 函数 来 划分 整数 。 对 层 i， 整 数 划 分 到 A(i， 四 定义 的 块 中 。 对 于 j 送 1， 
块 (i，0) 含 从 0 到 A(i，1) 一 1 的 整数 ， 块 (i, DEMAG, DRAG, j+ D-LAM. Wan, Ht 
El, 

Al, j) = 2/ 
这 样 ， 这 些 块 可 说 明 如 下 : 








对 层 2， 
A(2, 1) =2? 
A(2, 2) =2*= 16 
AQ, 3)= 2'° = 65 536 
对 层 3， 
A(3, 1) =2*= 16 
A(3, 2)=A(2, AGB, 1)) 
= A(2, 16) 
=A(1, A(2, 15)) 
= 24215) 
由 于 4(2，3) 已 经 是 一 个 非常 大 的 数 ，4(2，15) 对 于 实际 目标 是 个 非常 大 的 数 ，242 可 看 
作 是 无 限 。 
组 合 这 三 层 得 到 如 图 10-44 所 示 的 图 表 。 


0 21 r P 24 25 2 7 28 29 2% 2" 22 283 24 25 26 
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一 


层 
和 


图 10-44 对 应 于 阿 克 曼 函数 的 不 同 层 


假定 有 一 个 整数 2，<i<24， 那 么 在 层 1， 它 在 块 (1 ，3) 中 ， 在 层 2， 它 在 块 (2，1) 中 ， ER 
3， 它 在 块 (3，0) 中 。 
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如 之 前 所 定义 的 ，p(X) 表 示 结 点 x 的 父 结 点 。 现 在 x 的 层次 定义 成 使 rank(Xx) 和 rank(p(x)) 在 
技 i 刘 分 的 同一 个 块 内 的 最 小 层 i。 如 果 x = p(x)， 那 么 x 的 层 是 0。 假 定 rank(x) 在 块 (1 ，1) 中 ， 
rank(p(x)) 在 块 (1 ，3) 中 ， 那 么 x 在 层 3。 另 一 方面 ， 如 果 rank(x) 在 块 (1 ，3) 中 ，rank(p(x)) 在 块 
(1，6) 中 ， 那 么 x 在 层 4。 

层 有 多 高 呢 ?” 当 然 ， 如 果 层 很 高 使 得 该 层 的 第 一 块 包含 log, n， 那 么 该 层 因为 一 个 简单 原 
因 足 够 高 ， 根据 性 质 35，log;,n 是 最 大 可 能 的 秩 。 现 在 验证 一 个 例子 ,假如 4 = 2“， 这 已 经 足够 
大 。 在 此 情形 下 ，log,n = 16。 如 图 10-44 所 示 ， 这 包含 在 层 4 的 第 一 块 内 。 回 忆 

alm, n)= min{i> 1 |AG, (minj) >log, n} 

可 以 很 容易 明白 4(a(m， 门 ，m/m)>log:ma。 换 句 话 说 ，a(mz，mD+1 是 结 点 能 被 关联 的 最 高 层 。 

现在 考虑 涉及 路 径 x;/，… ，x, 的 一 次 find 操 作 。 一 个 典型 的 例子 如 图 10-45 所 示 。 在 图 
10-45 中 ， 每 个 结 点 关联 一 个 秩 ， 利 用 rank(x; ) 和 rank(x;, !)， 可 确定 每 个 x; 的 层 。 

对 于 每 个 i，0<i< al(m，n) + 1， 分 配 在 该 路 径 上 层 ;的 最 后 一 个 结 点 为 贷方 结 点 ， 其 他 结 
点 为 借方 结 点 。 所 有 的 贷方 结 点 和 借方 结 点 显示 在 图 10-45 中 。 根 据 贷 方 结 点 的 定义 ， 任 何 
find 路 径 的 贷方 结 点 的 总 数 是 以 Q(m，n) + 2 为 界 。 因 此 ， 被 算法 转换 的 贷方 结 点 总 数 是 以 
m(a(m, n)+2)a R. 





























$k E 贷方 /借方 
“u 贷方 
Xio 
Xo 
Xg 
xy 
X6 
5 
X4 
%3 
x2 





图 10-45 贷方 结 点 和 借方 结 点 


现在 讨论 结 点 的 层 如 何 那 么 高 。 根 据 定义 ， 如 果 结 点 x 的 rank(x) 和 rank(p(x)) 的 差 非常 大 ， 
那么 x 的 层 就 高 。 所 以 ， 可 能 有 下 面 的 问题 .x 的 父 结 点 的 秩 比 x 的 秩 怎 么 高 出 那么 多 ? (只 有 
两 种 操作 : 合并 和 压缩 。 当 执行 一 次 合并 操作 ，x 的 秩 与 p(x) 的 秩 间 的 差别 仅 是 1 一 一 译 者 注 ) 

当 执 行 压缩 操作 时 ， 结 点 x 的 秩 与 其 父 结 点 的 秩 间 的 差别 将 非常 显著 。 设 想 在 图 10-45 的 
路 径 上 执行 find 操 作 ， 在 find 操 作 之 后 ， 路 径 将 被 压缩 ， 如 图 10-46 所 示 。 尽 管 x, 的 秩 仍然 是 1， 
但 其 父 结 点 的 秩 突 变 为 150。 这 样 ， 现 在 x 的 层 从 1 增加 到 4。 

总 之 ，find 操 作 路 径 中 的 结 点 在 find 操 作 之 后 ， 会 有 一 个 新 的 父 结 点 ， 并 且 新 的 父 结 点 必 
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定 有 一 个 较 高 的 秩 。 我 们 将 证 明 ， 如 果 x 在 层 i 是 借方 结 点 ， 并 且 rank(Co 在 块 ( 一 1， 旋 中， 那么 
新 的 父 结 点 实际 上 是 树 的 根 ， 将 在 块 (一 1， 门 
中 ， 其 中 站 > j。 

假定 结 点 x* 的 层 是 i, rank(x) 在 块 (i 一 1, DP, 
令 x 的 父 结 点 p(x) 的 秩 在 块 (i 一 1 j'p, WA, 
(Al Arank(p(x))>rank(x), 4%’ >j, weit, /' 
+j, 否则 ，x 将 在 层 王 1。 因 此 推断 ， 如 果 结 点 
x 的 层 是 ;，ranKk(z) 在 块 ( 一 1， 旋 中 ， 那 么 p(OO 的 图 10-46 find 操 作 之 后 图 10-45 的 路 径 
FKE, 站) 中 ， 其 中 j' >j。 

考虑 图 10-47， 其 中 必 ,是 x NRA, xy 
是 在 层 i 的 一 个 借方 结 点 。 由 于 x 是 一 个 借方 结 
点 ， 根 据 定 义 ， 一 定 有 贷方 结 点 ， 比 如 说 x。 ， 
必定 在 x 与 该 路 径 的 根 x, 之 间 。 令 x ,是 x 的 父 
EA, WME, X, Xa Xar Xu ot PAX, 的 秩 分 
WÆHR G-I, j). G1, j), G1, h), (i-t, 
六 和 (六 1，A) 中 ， 如 下 所 示 。 


X11 


xy X2 Xw 









x, 


Xari = plxq) 


Xa 在 i 层 上 的 贷方 结 点 


Xgl = py) 


% EIR EOD E 


rank 图 10-47 在 路 径 中 结 点 的 秩 
X; (i-l, jò 
Xa (i~i, j) 
Xa (i=l, Js) 
kasi (i-1, jò 
x, (一 1 js) 


现在 ， 由 于 x 的 层 是 i 可 得 jp> jio 

由 于 ,在 x ,1 与 xX, 之 间 ， 可 得 jy 之 jh。 

由 于 Xx, 的 层 也 是 i， 可 得 js > jho 

BA, WB. Js. 

简 而 言 之 ， 可 以 得 到 ji<j; < js 

土 面 的 讨论 解答 了 一 般 的 情形 。x。 = x AX, = x ,1 也 是 可 能 的 。 在 此 情形 下 ， 相 关 的 讨 
论 只 涉及 三 个 结 点 ， 即 x 、xi , ,和 x, 。 很 容易 证 明 对 一 般 及 特殊 情形 ， 下 面 的 陈述 是 正确 的 : 
Ax BERINERB A, 4 ERER, x, BRA. Srank(x,), rank(x,.,)Arank(x, ) 分 别 
在 块 (i 一 1 J. G-1, 7 )ANG-1, j", MBAi<j' <j", MPH 10-48 AR. 


rank(x,) rank(X,41) rank(x,) 








图 10-48 在 层 i 一 1 中 x Xfi, OR 


在 -一 次 find 操 作 之 后 , 由 于 路 径 压 缩 方法 , 路径 中 除了 根 结 点 外 的 每 个 结 点 都 变 成 叶 结 点 。 
根据 定义 ， 叶 结 点 是 贷方 结 点 。 这 样 ， 在 find 操 作 之 后 ， 借 方 结 点 将 变 为 贷方 结 点 。 只 要 没有 
合并 操作 ， 它 将 保持 是 贷方 结 点 ， 而 在 link 操 作 后 ， 它 将 再 次 变 为 借方 结 点 。 

每 次 find 操 作 使 一 个 借方 结 点 有 新 的 父 结 点 ， 新 的 父 结 点 的 秩 将 高 于 先前 父 结 点 的 秩 。 
此 外 ， 如 上 面 所 证 明和 的 ， 新 的 父 结 点 的 秩 将 在 较 高 层 (i 一 了 ) 的 块 中 。 令 Bb 表示 层 (i~1) 的 块 数 ， 
它们 与 块 (i，)) 的 交集 非 空 。 例 如 ，5,， = 12, bo = 2， 那 么 可 说 当 x 是 一 个 借方 结 点 时 ， 在 
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b; 一 1 次 find 操 作 转 换 x 一 次 后 ，rank(x) 和 rank(p(x)) 将 在 不 同 的 层 i 块 中 。 或 者 ， 更 详细 地 ， 
Eb; 一 1 次 借方 结 点 改变 后 ，x 的 层 增 加 到 i +1。 也 可 以 说 成 最 大 b; 一 1 次 借方 结 点 改变 后 ，x 
的 层 数 增 1 。 

令 mj 表示 秩 在 块 (i， 让 中 的 异 方 结 点 的 总 数 。find 操 作 能 够 转换 借方 结 点 的 总 次 数 至 多 是 


almy 
Q= > Dw 
ief j> 


ETERA P, HERA RIES ORLA, UH Se a Se RR. Kb, WRIA 
对 分 摊 分 析 的 基本 规律 感 兴趣 ， 那 么 可 以 简单 地 忽略 此 部 分 的 讨论 。 
再 次 考虑 图 10-44 所 示 的 划分 图 表 ， 可 以 划分 该 图 表 为 三 部 分 ， 如 图 10-49 所 示 。 


SS 
bd “OR 


Wp 
AAA 


| C 部 分 





图 10-49 对 图 10-44 中 图 表 的 划分 
这 样 ， 可 以 得 到 


Q= D Jrut- -1) 


= $h no(bo ~ 1) (4 部 分 ) 
+ » Bean (8 部 分 ) 
+ MaimaysioPaimnsio -D (CRA) 


先 计 算 4 部 分 。 根 据 定义 ， 
block(i,0) = [0,---, AG, D - 1] 
=[0,---, A@-1,2)-1] 
=[0,---,A@-1,1),---, A@-1,2)-]] 
这 意味 着 block(i，0) 徐 盖 两 个 (i 一 1) 层 的 块 ， 即 块 (i 一 1，0) 和 (i 一 1，1)。 所 以 ， 可 以 得 到 
bn=2 
另 一 方面 ，nio <n, 这 样 ， 对 4 部 分 


ana) aimn) 
> Nio(Diy - 1) < >, n(2-1)=na(m,n) 


下 面 计 算 B 部 分 ， 就 是 








282 $10 
a(n) 
> Xm; -D 
首先 推导 心 的 上 界 。 根 据 上 面 性 质 4 的 讨论 ， 
AU jt} 
ni < Td! 
ke Aj) 
< n/2' 
>»! 
< 2n/2"" 
= n/Qr' (10-1) 
对 于 by ，1 <i< olm， nn) 及 j 之 1,， 一 般 也 可 以 得 到 一 个 上 界 。 
block(i, J =[ Ali, J), =, AG, j+ D-1] 
=[A(i-1, A(i, j- 1), : “9 A(i— l, A(i, D-H 
=[AQG-1, AG, j-1)), AG-1, AG, j= 1)+ 1), +, AG-1, AG, D-H 


这 意味 着 对 于 [<i< alm，n) 和 /之 1，block(i, MRA’, N-AG, j-1) (i 一 1) 层 的 块 。 在 


此 情形 下 ， 
b; SAG, j) 
将 公式 (10-bD 和 式 (10-2) 代 入 B 部 分 ， 可 以 得 到 


(CD) 


> 2 yt jbj- 
人 名 


a(m,n) 


> nb; 


人 


2i 
i=| jz1 


alm,n) 


> Dyn 2 NAG, i) 


aimn) 


n> X Ai, piri 


m 73I 


A 


令 1= Ali, j), "TLAS 


a(mn) 


> dri -) 
fal fet 


aumn) 


<n) D2 
Tat =A j) 


jal 
aun) 


=n > (CAG, 1/246") + (AG, 2)/ 2407") 4) 


alm,n) 


n > (AGI) 240") + (AG D + 2/246”) 
+ (AGL) + 29/240") +) 


a= Ai, Jh 这 样 ， 必须 找 出 下 列 值 


S = San =(a)/2°' +(a+1)/2" +(a+2)/2° + 


ta 


(10-2) 


(10-3) 
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28, =a/2"? +(a+l)/2" +(a+2)/2" +- (10-4) 
将 式 (10-4) 减 式 (10-3)， 可 以 得 到 
S =a/2? +(1/2" +1/2° +1/2"" +---) 
=a/2"? +1/2°? =(a+D12 和 
这 样 ， 
atin) 


n 六 (4AGD125 y+ (ated +12") 


+ ((AGi,1) + 2)/ 240) 4) 
aun) 
=n 4GD+D120 
<n((A(L,1) + 1)/24"? + (AQ, D+ 12/24? 
+ (AGI + D/24 4-9 
<n((2+1)/2?? +3 41)/2°? + (44/2? +--+) 


an depo" 
t> 


yeni = 3/2 +(1/2° 41/2! 41/2? +++) 


容易 证 明 


=0+2 
=8 


这 样 ， 对 于 8 部 分 ， 可 以 得 到 


aimn) 


信之 Snb- 
最 后 ， 对 于 C 部 分 ， 


Nam, mal Damn, mato 1) Sam, mat Pam, ny+1,0 (10-5) 
Nam, n +l,0<n (10-6) 


block(a(m, n)+1, 0) 
= [0， ay A(a(m, n), min)—1] 
= (0, ty A(a(m, n), 1), a) A(a(m, n), 2), oan) A(a(m, n), min)—1] 


这 意味 着 block(a(m，n) + 1，0) 覆 盖 m/n(i 一 1) 层 的 块 。 这 样 ， 
bam, muo = [In] (10-7) 
对 于 C 部 分 ， 将 公式 (10-6) 和 式 (10-7) 代入 公式 〈10-5) ， 得 到 
Ream, mioban, 1+10-1) <n [min] <m 
概括 地 说 ， 对 于 Q， 
Q<na(m, n)+8n+m= (alm, n)+8n+m 


注意 ，m 次 find 操 作 所 花费 的 总 时 间 等 于 find 操 作 转换 的 贷方 结 点 数 与 借方 结 点 数 之 和 。 
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仅 有 两 种 结 点 : 贷方 结 点 和 借方 结 点 。 转 换 的 贷方 结 点 数 以 (a(m，n) + 2)m 为 界 ， 转 换 的 借方 
结 点 数 以 (a(m，n) + 8)n + mm 为 界 。 

这 样 ， 推 导出 由 find 操 作 花 费 的 平均 时 间 是 O(a(m，n))。 

由 于 ca(m ， 站 几乎 是 一 个 常数 ， 所 以 分 摊 分 析 表 明 find 操 作 花 费 的 平均 时 间 是 一 个 常数 。 


10.7 一些 磁盘 调度 算法 的 分 摊 分 析 


在 计算 机 科学 中 ， 磁 盘 调 度 问 题 是 很 有 趣 的 ， 实 际 上 也 是 非常 重要 的 问题 。 考 虑 单一 磁 
盘 ， 数 据 存储 在 不 同 的 柱 面 上 。 在 任何 时 间 ， 都 有 检索 数据 的 请 求 集 ， 该 请 求 集 称 为 等 待 队 
列 (waiting queue) ， 这 些 请 求 称 为 等 待 请 求 (waiting requests)。 磁 盘 调 度 问 题 是 选择 一 个 请 
求 来 服务 。 

例如 ， 假 定 有 一 个 检索 数据 的 请 求 序 列 ， 数 据 分 别 存放 在 柱 面 16，2，14，5 和 21 上 。 磁 
头 初始 时 在 柱 面 0 上 ， STREAM chel am EOM A A, 现在 证 明 磁 盘 调 度 算 
法 怎样 产生 不 同 的 结果 。 

先 考 处 先 来 先 服务 (first-come-first-serve, FCFS) 算法 。 磁 头 先 移动 到 柱 面 16， 然 后 移 
动 到 柱 面 2， 之 后 到 14， 等 。 用 于 请 求 的 服务 总 时 间 是 i0 一 16| + 116-21 + 12—141 + 114-5 + 15 一 
21= 16+ 1441249 + 16= 67, . 

设想 使 用 另 -一 种 算法 ， 称 为 最 短 寻 道 时 间 优 先 (shortest-seek-time-first, SSTF) 算法 。 
在 该 算法 中 ， 磁 头 总 是 移动 到 最 近 的 柱 面 上 上。 这样， 磁头 首先 移动 到 柱 面 2， 然 后 移动 到 $， 
之 后 到 14， 等 。 这 样 ， 用 于 请 求 的 服务 总 时 间 是 I0--21 + 12-5! + 5-14 + 114-161 + 116-211 = 
2+3+9+2+5S=21， 这 比 67 小 很 多 。 

在 本 节 中 ， 假 定 在 请 求 服务 时 ， 新 的 请 求 不 断 进 来 。 同 时 假定 等 待 队 列 能 容纳 m 个 请 求 ， 
任何 这 mm 个 请 求 以 外 的 请 求 将 被 丢弃 。 换 句 话说， 考虑 请 求 的 最 大 数 是 普 。 另 一 方面 ， 也 假定 
至 少 有 Ww 个 请 求 ， 其 中 W 之 2。 磁 盘 总 的 柱 面 数 是 8 + 1， 令 4 表示 第 ;个 服务 所 花费 的 时 间 。 主 


要 关注 > 的 计算 。 正 如 所 期 望 的 ， 要 找 出 > 的 上 界 。 如 之 前 所 做 的 ， 令 a; (x) = 1; (x) 


+p Dga, HPARR-THENRE, ¢ 表示 请 求 的 第 i 次 服务 之 后 的 势能 ，ai ORR 
第 i 次 服务 的 分 摊 时 间 。 
可 以 得 到 ， 


Sa - So +a- 9.09) 
- 9109+ 5469-0 
ye) - Saco) £492) $0) 
RH Ši (9 上 界 的 策略 现在 变 为 找 出 .0 的 上 界 ， 令 此 上 界 表示 为 AD， 那么 


Dh < mA(x)+ p(x) ~ pn (x) 


在 本 节 的 剩余 部 分 ， 将 讨论 使 用 分 摊 分 析 如 何 分 析 两 磁盘 调度 算法 ， SSFT 算 法 和 SCAN 
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最 短 寻 道 时 间 优 先 (SSTF) 算法 的 分 析 
在 SSTF 算 法 中 ， 等 待 队列 将 服务 最 近 的 请 求 。 考 虑 第 i 次 服务 之 后 的 情况 ，1 <i<m。 令 
Ni (SSTF) 表 示 在 当前 服务 方向 上 等 待 的 请 求 数 ，L; (5STF) 表 示 磁 头 与 最 近 请 求 之 间 的 距离 ， 
D,(SSTF) 表 示 在 服务 方向 上 的 柱 面 数 。L;(SSTF) 和 D;(SSTF) 的 定义 如 图 10-50 所 示 。 
第 i 次 服务 之 后 的 磁头 位 置 ”最近 的 请 求 


| 


| 
| 一 Li(SSTF) —| 


}«—_—_———— D,(SSTF) 


H 








— (k5 Fi bat ) 
图 10-50 L(SSTF) 与 D,(SSTF) 的 定义 
SSTF 算 法 的 势能 函数 可 以 定义 如 下 : 


L,(SSTF) 如 果 N, (SSTF) = 1 
SSTP) = {ming (SSTF),D(SSTEY| 2} ARN, (SSTF) > 1 (10-8) 
从 公式 (10-8) 中 ， 很 容易 证 明 
¢,(SSTF)>0 (10-9) 
下 面 将 证 明 
¢, (SSTF)<Q/2 (10-10) 
考虑 两 种 情况 : 


情况 1，N (SSTP) = 1。 
由 于 假设 多 >2， 在 相反 的 方向 上 至 少 有 一 个 请 求 ， 如 图 10-S1 所 示 。 令 在 磁头 与 反方 向 上 
最 近邻 请 求 的 距离 为 ?， 那 么 b + L(SSTF)<Q。 而 Li(SSTF) <b; 否则， 将 颠倒 服务 方向 。 


最 近邻 的 请 求 第 次 服务 之 后 的 磁头 位 置 。 最 近 的 请 求 w 
! ! 


' 
|. b 一 一 -一 LssTR) —| 


(服务 方向 ) 








图 10-51 N(SSTP) = 1 的 情况 

所 以 ， 
2L, (SSTF)<L, (SSTF) + b<Q 
RH, L,(SSTF)<Q/2, 
这 意味 着 办 (SSTF) = Li (SSTF)<Q/2, 
这 是 由 于 9 (SSTF) 的 定义 是 公式 (10-8) 所 描述 的 。 
情况 2，N (SSTF) 之 2。 
由 于 D, (SSTF)<QO，D; (SSTF)/2<Q/2。 所 以 ， 根 据 公 式 (10-8), 
¢, (SSTF) = min{L, (SSTF), D; (SSTF)/2} 

<D, (SSTF)/2 
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<Q/2 
很 容易 得 到 9 (SSTF) 的 另 一 个 上 界 ， 即 
¢; (SSTF)< L, (SSTF) 
上 面 的 等 式 用 于 求解 下 式 的 上 界 
a; (SSTF) = 1, (SSTF) + 9, (SSTF) 一 由 (937P) 
为 了 求解 ， 需 要 考虑 下 面 两 种 情况 : 
情况 1. N，,(SSTF) = 1。 
在 此 情况 下 ， 根 据 公 式 (10-8)， 可 得 
¢, (SSTF) = L; \(SSTF) = t; (SSTF) 
这 样 ， 
a; (SSTF) = t, (SSTF) + 9, (SSTF) -由 \(SSTF) 
= 1; (SSTF) + ¢, (SSTF) ~ L; \(SSTF) 
< 1,(SSTF) + Q/2-1,(SSTF) (根据 公式 (10-10) 和 公式 (10-12)) 
= Q/2 
情况 2. N _,(SSTF)>2, 
这 又 有 两 种 子 情 况 。 
情况 2.1 N, ,(SSTF)>2, HL, (SSTF) <D,_\(SSTF)2, 
对 于 此 种 情况 ， 根 据 公 式 (10-8), 
由 (SSTF) = min{L, (SSTE), D, (SSTFY/2} < L, (SSTF) 
由 此 ， 正 如 情况 1 一 样 ， 可 以 证 明 
a; (SSTF) < Q/2 
情况 2.2 N,_(SSTF)>1, ALL,(SSTF)>D, _(SSTF)/2. 
对 于 此 种 情况 ， 根 据 公式 (10-9), 
$; (SSTF) = D, (SSTFY/2 


(10-11) 


(10-12) 


由 于 N，,(SSTF)>1， 除 了 最 近 请 求 外 ， 在 服务 方向 上 一 定 还 有 一 些 请 求 。 令 c 是 在 服务 方 


向 上 最 近 的 请 求 与 第 二 近 的 请 求 间 的 距离 。 图 10-52 表 示 此 种 情况 。 


第 ;次 服务 之 前 的 磁头 位 置 ”最 近 的 请 求 第 三 近 的 请 求 





! | | 
oem 
þ-—— DSTA | 





(服务 方向 ) 





图 10-52 N,,(SSTF)>1， 且 L,1(SSTF)>D,_ (SSTF)/2 的 情况 
由 于 使 用 SSTF 算 法 ，L; (SSTF)<c。 这 样 ， 可 得 
L; (SSTF)<c<D, (SSTF) — L; (SSTF) 


(10-13) 
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这 样 ， 
a; (SSTF) = t, (SSTF) + 由 (SSTF) 一 轴 .,(SSTF) 
<t; (SSTF) + L; (SSTF) — $,.,(SSTF) (根据 公式 (10-11)) 
<t; (SSTF) + (D; -(SSTF) — L; .(SSTF)) — 9, \(SSTF) (根据 公式 (10-13)) 
= L, \(SSTF) + D;_,(SSTF) — L; _\(SSTF) — $ ,(SSTF) (BlAt, (SSTF) = L; .,(SSTF)) 
=D, .(SSTF) — $; _\(SSTF) 
=D, _(SSTF)/2) (BA ¢; .\(SSTF) = D, _,(SSTF)/2) 
<Q/2 (KAD, .(SSTF)<Q) 
将 情况 1 和 2 合并 ， 得 到 


a,(SSTF) <Q2 (10-14) 
将 公式 (10-14), (10-9) 和 (10-10) 合并 ， 可 以 找 出 S "(SSTF) 的 上 界 为 


> 1(SSTF) < a (SSTF) + h (SSTF) - ¢,,(SSTF) 


m 


， 因 为 @(SSTF) 的 最 大 值 是 8/2，9,, (5STF) 的 最 小 值 是 0， 所 以 有 


> (SSTF) < ya (SSTF) + ¢,(SSTF) - @, (SSTF) 
< mQ/2+Q/2-0 
= (m+1)Q/2 (10-15) 
对 于 SSTF 算 法 ， 等 式 〈10-15) 说 明 m 个 请 求 的 总 时 间 花 费 是 (Gm + 1)8/2。 或 者 等 价 地 说 ， 
该 算法 需要 的 时 间 花 费 是 0/2。 
为 了 证 明 上 界 (m + 1)Q/2 不 能 再 紧 致 。 考 虑 m 个 请 求 的 序列 ， 分 别 位 于 如 下 柱 面 : 
l (Q/2, Q, (0, Q2)", 0) 
其 中 心 表示 人 总 站。 假如 在 任何 时 间 等 待 的 请 求 数 是 2，(m-3) 能 被 2 整除 。 在 此 情况 
下 ， 磁 头 将 在 柱 面 2/2 与 0 之 间 摆 动 ， 表 示 如 下 : 
(9/2, oy"-2, Q) 
这 样 ， 该 请 求 总 的 服务 时 间 是 
(Q/2 + Q/2) (m—1) /2 + Q = (m + DQ 
这 意味 着 公式 (10-15) 表示 的 上 界 不 能 进一步 紧 致 。 
SCAN 算 法 的 分 摊 分 析 
如 前 面 所 讨论 的 ，SSTF 算 法 可 能 迫使 磁头 来 回 摆动 。 通 过 在 当前 搜索 方向 上 选取 最 近 请 
求 ，SCAN 算 法 避免 了 该 问题 。 这 样 ， 如 果 磁 头 正 移 向 一 个 方向 ， 那 么 它 可 以 继续 进行 到 在 该 
方向 上 没有 请 求 为 止 。 此 时 ， 磁 头 再 倒转 方向 。 
考虑 第 i 次 服务 之 后 的 状态 。 现 在 定义 两 个 术语 N; (SCAND, (SCAN) 如 下 : 如 果 在 第 (i + 
1) 次 服务 时 ， 没 有 改变 搜索 方向 ， 那 么 N (SCAN) 和 D; (SCAN) 分 别 定义 为 已 经 服务 的 请 求 数 及 


磁头 在 当前 搜索 方向 上 移动 的 距离 ， 否 则 ，N; (SCAN) 和 D; (SCAN) 都 置 为 0。No (SCAN) 和 
DA(SCAN) 都 是 90，SCAN 的 势能 函数 可 定义 为 
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4. (SCAN) = N,(SCAN)Q/W — D; (SCAN) (10-16) 
对 于 SSTF， 将 证 明 a, (SSTF) < 0/2。 对 于 SCAN， 将 证 明 a,(SCAMN) < Q/W。 
考虑 第 i 次 服务 ， 令 1,(SCAN) 表 示 第 i 次 服务 的 时 间 ， 又 有 两 种 情况 需要 考虑 。 
情况 1. 不 改变 第 (i+ DD) 次 服务 的 扫描 方向 。 在 这 种 情况 下 ， 显 然 可 以 得 到 
N,(SCAN) = N, (SCAN) + 1 以 及 
D,(SCAN) = D, (SCAN) + 1,(SCAN) 
a, (SCAN) = t; (SCAN) + @, (SCAN) — ¢, (SCAN) 
= t, (SCAN) + (N, (SCAN)Q/W —D,(SCAN)) 
~ (N,_,\(SCAN)Q/W —D,. (SCAN) 
= t, (SCAN) + ((N, (SCAN) + 1)Q/W— (D (SCAN) 
+ t, (SCAN)) — (N, (SCAN)Q/W—D,. (SCAN) 
=Q/W 
情况 2. 改变 第 (i +1) 次 服务 的 扫描 方向 。 在 这 种 情况 下 ,，N; (SCAN) = D,(SCAN), 
$b(SCAN) = 0。 
由 于 磁头 初始 定位 在 柱 面 0， 等 待 队 列 的 最 小 值 假设 为 W， 这 样 在 一 次 扫描 中 对 请 求 服务 
的 最 小 值 也 是 W。 也 就 是 ，N,,(SCAN)>(W-1)。 这 样 ， 
a, (SCAN) <t,(SCAN)—((W-1)Q/W—D,_,(SCAN)) 
< (t; (SCAN) + D, (SCAN)~Q) + QIW 


由 于 在 一 次 扫描 中 磁头 移动 的 最 大 距离 是 @， 
t, (SCAN) + D, (SCAN)<Q 
所 以 ， 


a,(SCAN) <Q/W (10-17) 
上 面 的 讨论 证 明了 aw (SCAN) <A (SCAN) = QIW, 
其 中 A(SCAN) 是 a;(SCAN) 的 上 界 。 
现在 ， 可 以 得 到 


m m 


D'SCAN) < Y a(SCAN) + (SCAN) - $,,(SCAN) 


m 


< mQ/W + (SCAN) - ¢,,(SCAN) 
但 是 ’ (SCAN) =0, 这 样 ` 


m 


D (SCAN) < mQ/W ~@,,(SCAN) 


为 估计 -9,,(SCAN) ， 再 次 考虑 两 种 情况 : 

情况 1. N,, (SCAN) = D, (SCAN) =0 (10-18) 
在 这 种 情况 下 ，%, (SCAN) = 0。 

情况 2. N, (SCAN) 之 一 与 D, (SCAN) 不 为 0。 

在 这 种 情况 下 ,，N, (SCAN) 21, HD<D,, (SCAN) <Q, 
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Pn (SCAN) = N„(SCAN)QIW — D,, (SCAN) 


>Q/W -0 (10-19) 
注意 到 C/W-C@<0， 我 们 合并 式 (10-18) 和 式 (10-19)， 可 以 得 出 结论 
n (SCAN) > QIW -0 (10-20) 


最 后 ， 可 以 得 到 
> t,(SCAN) <mQ/W -内 (SC4N) 

= mgiw -(OW-g) 

<(m—1)Q/W + Q (10-21) 

A (10-21) 表明 由 这 m 次 请 求 所 需 的 时 间 耗 费 不 大 于 (m 一 1)Q/W + 8。 对 于 SCAN 算 法 ， 
一 次 请 求 的 平均 时 间 耗 费 不 大 于 ((m 一 DQ/W + Q)/m。 

由 于 之 前 所 证 明 的 ， 现 在 我 们 可 以 证 明 上 界 (m 一 1)Q/W + 8 不 可 能 再 进一步 紧 致 了 。 我 们 
可 以 证 明 该 结论 ， 通 过 考虑 分 别 定位 在 柱 面 

((O4， Oye 8 ， Q) 

上 的 m 次 请 求 序 列 ， 并 假设 在 任何 时 间 ， 等 待 请 求 的 数量 是 4。 令 W = 4， 假设 (m 一 1) 能 被 8 整 
除 。 因 此 ， 该 请 求 序列 也 可 被 序列 ((Q*，0)”"，Q) 调 度 和 处 理 。 

该 序列 总 的 服务 时 间 是 ((m 一 1)/8)28 + Q = ((m-DA(2W)20 + Q =(m-1)QIW +Q. 

这 说 明 在 式 (10-21) 中 表示 的 总 的 时 间 上 界 不 能 被 紧 致 。 . 

现在 ， 通 过 比较 式 (10-15) 和 式 (10-21) RAEE PAE. MA (10-15)， 可 以 得 到 


m 


tae (SSTF) = > 1, (SSTF)/m< (m + 1)Q/(2m) (10-22) 
随 着 m 一 o ， 可 以 得 到 
t. (SSTF)<Q/2 | (10-23) 
从 式 (10-21)， 可 以 证 明 
t (SCAN) < QIW (10-24) 


由 于 W 之 2， 通 过 对 这 两 个 算法 的 分 摊 分 析 可 以 得 出 结论 1 (SCAN) < tave (SSTF), 
10.8 实验 结果 


、 、 , 、 、 表 10-9 不 相交 集合 并 算法 的 分 捧 分 析 实 验 结果 
分 摊 分 析 通 常 涉及 很 多 数学 背景 ， 对 于 许 “ 一 
多 研究 者 来 说 ， 结 果 应 该 是 怎样 的 并 不 那么 直 操作 次 数 总 时 间 (毫秒 ) “平均 时 间 (GRD) 





观 清晰 。 例 如 ， 不 相交 集合 并 算法 的 平均 性 能 ooo io a 
几乎 是 一 个 常数 ， 这 对 任何 人 来 说 都 不 是 那么 4000 210 53 
明显 。 所 以 ， 我 们 实现 了 不 相交 集合 并 算法 ， 5000 270 54 
使 用 的 数据 有 10 000 个 元 素 ， 由 随机 数 生成 器 7000 380 54 
来 决定 下 一 个 棵 作 是 查找 或 是 连接 。 程 序 用 oo too 2 
Turbo Pascal 编 写 ， 并 在 IBM PC 上 执行 。 表 13 000 710 55 
10-9 总 结 了 结论 。 14 000 760 54 


从 实验 结果 可 知 ， 分 摊 分 析 准 确 地 预测 了 15 000 820 55 
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不 相交 集合 并 算法 的 行为 。 对 于 一 个 操作 序列 ， 有 关 的 总 时 间 在 递增 。 然 而 ， 每 个 操作 的 平 
均 时 间 是 个 常数 ， 正 如 分 摊 分 析 所 预测 的 。 


10.9 注释 与 参考 


术语 分 摊 分 析 首 先 在 文献 Tarjan(1985) 中 提出 。 然 而 ， 此 概念 在 1985 前 已 由 许多 研究 者 在 
使 用 。 例 如 ， 在 文献 Brown and Tarjan(1980) 中 对 2-3 树 的 分 析 ， 在 文献 Huddleston and 
Mehilhorn(1982) 中 对 弱 B 树 的 分 析 都 使 用 了 此 概念 ， 尽 管 在 当时 并 没有 使 用 “分 摊 ”。 

斜 堆 的 分 摊 分 析 可 在 文献 Sileator and Tarjan(1986) 中 找到 ， 文 献 Mehlhorn and 
Tsakalidis(1986) 对 AVL 树 给 出 了 分 摊 分 析 ， 自 组 织 顺 序 搜索 启发 式 的 分 摊 分 析出 现在 文献 
Bentley and McGeoch(198$)。 配 对 堆 的 分 摊 分 析 可 参阅 文献 Fredman ，Sedgewick Sleator 
and Tarjan(1986)， 不 相交 集合 并 算法 的 分 摊 分 析 可 在 文献 Tarjan(1983) 和 Tarjan and Van 
Leeuwen(1984) 中 找到 。 

分 摊 分 析 经 常用 在 涉及 相关 数据 结构 及 反复 应 用 在 该 数据 结构 上 的 操作 序列 的 算法 中 。 
例如 ， 在 文献 Fu and Lee(1991) 中 ， 需 要 一 个 数据 结构 使 树 可 以 动态 高 效 地 得 到 处 理 。 也 就 是 
许多 树 操作 ， 像 检查 边 、 插 入 边 等 都 可 以 实现 。 在 这 种 情况 下 ， 可 以 使 用 动态 树 (Sleator and 
Tarjan，1983) 并 进行 分 摊 分 析 。 

分 摊 分 析 也 应 用 于 分 析 一 系列 操作 的 一 些 实际 策略 中 。 文 献 Chen，Yang and Lee(1989) 对 
一 些 磁盘 调度 方法 进行 了 分 摊 分 析 。 

非常 少 的 教科 书 讨论 分 摊 分 析 概 念 ， 但 文献 Purdom and Brown(1985a) 和 Tarjan(1983) 对 此 
做 了 讨论 。 


10.10 进一步 的 阅读 资料 


对 于 分 摊 分 析 的 回顾 和 介绍 性 的 讨论 可 参阅 文献 Tarjan(1985)。 对 于 分 摊 分 析 ， 下 面 的 论 
文 都 是 最 近 出 版 的 ， 对 于 进一步 的 阅读 有 极 高 的 推荐 价值 : Bent，Sleator and Tarjan(1985); 
Eppstein, Galil, Italiano and Spencer(1996)， Ferragina(!997),; Henzinger(1995), 
Italiano(1986); Karlin, Manasse, Rudolph and Sleator(1988); Kingston(1986), 
Makinen(1987); Sleator and Tarjan(1983), Sleator and Tarjan(1985a); Sleator and 
Tarjan(1985b),; Tarjan and Van Wyk(1988), LA Re Westbrook and Tarjan(1989), 


习题 


10.1 对 于 在 10.1 节 中 讨论 的 栈 问 题 ， 证 明 : 不 使 用 势能 函数 上 界 是 2， 并 给 出 例子 说 明 该 上 
界 也 是 紧 致 的 。 

10.2 设想 一 个 人 的 唯一 收入 是 月 薪 ， 假 如 是 每 月 K 个 单位 。 只 要 他 的 银行 账户 有 足够 的 钱 ， 
他 就 可 以 花费 任意 数量 的 钱 。 每 月 他 将 个 单位 的 工资 存 和 人 银行 账户 中 。 你 能 对 该 人 的 
行为 进行 分 摊 分 析 吗 ? (定义 你 的 问题 ， 注 意 ， 他 不 能 在 任何 时 间 取 出 大 量 的 钱 。) 

10.3 分 捧 分 析 隐 含 着 相关 的 数据 结构 有 某 种 自 组 织 机 制 。 换 句 话说 ， 当 它 变 得 非常 差 时 ， 有 
机 会 变 向 好 的 方向 。 在 这 种 情况 下 ， 通 过 分 摊 分 析 能 分 析 这 种 杂乱 的 情况 吗 ? 对 该 主题 
做 些 研究 ， 也 许 你 能 发 表 一 些 论文 呢 。 

10.4 选择 并 实现 在 本 章 所 介绍 的 任意 算法 。 完 成 一 些 实验 ， 检 验 对 分 摊 分 析 的 理解 。 

10.5 阅读 关于 动态 树 数据 结构 的 文献 Sleator and Tarjan(1983)。 





第 11 章 随机 算法 


随机 算法 (randomized algorithm) 的 概念 相对 较 新 。 本 书 到 目前 为 止 所 介绍 的 每 一 种 算 
法 中 的 每 一 步 都 是 确定 的 。 也 就 是 说 ， 在 执行 算法 的 过 程 中 ， 从 未 做 出 任何 随心 所 和 欲 的 选择 。 
在 本 章 将 要 介绍 的 随机 算法 可 以 做 出 任意 的 选择 ， 这 意味 着 可 随机 地 执行 某 些 动作 。 

由 于 某 些 动作 的 执行 是 随机 的 ， 后 面 将 要 介绍 的 随机 算法 具有 下 面 两 个 属性 : 

(1) 在 最 优化 问题 的 情况 中 ， 随 机 算法 给 出 一 个 最 优 解 。 但 是 由 于 在 算法 中 随机 地 采取 动 
作 ， 因 此 随机 最 优 算法 (randomized optimization algorithm) 的 时 间 复 杂 度 也 是 随机 的 。 这 样 ， 
随机 最 优 算法 的 平均 情况 时 间 复 杂 度 远 比 它 的 最 坏 情况 时 间 复 杂 度 重要 。 

(2) 在 判定 问题 的 情况 中 ， 随 机 算法 有 时 会 出 错 。 然 而 ， 产 生 错 误 的 概率 是 非常 小 的 ， 另 
外 ， 随 机 算法 并 非 总 是 有 用 。 


11.1 解决 最 近 点 对 问题 的 随机 算法 


我 们 曾 在 第 4 章 介绍 过 最 近 点 对 问题 。 在 第 4 章 中 ， 我 们 已 经 证 明 这 个 问题 可 通过 分 治 法 
在 O(n log 站 时 间 内 得 到 解决 ， 这 是 最 坏 情 况 下 的 时 间 复 杂 度 。 在 本 节 中 ， 将 介绍 一 种 随机 算 
法 ， 使 用 该 算法 解决 这 个 问题 的 平均 情况 时 间 复 杂 度 是 O(n)。 

Bx, yo, x, 为 二 维 平面 上 的 a 个 点 。 最 近 点 对 问题 是 找到 最 近 的 一 对 点 x; 和 x; ， 使 得 
x 5x 之 间 的 距离 是 所 有 可 能 的 点 对 距离 中 最 小 。 解 决 该 问题 的 直接 方法 是 计算 出 所 有 的 
n(n 一 1)/2 个 点 对 之 间 的 距离 ， 并 在 这 些 距 离 中 找 出 最 小 值 。 

该 随机 算法 的 主要 思想 基于 下 面 的 观察 ， 如 果 两 个 点 x) Fox, 彼此 和 远离， 那么 它们 之 间 的 距 
离 不 可 能 最 小 ， 因 此 可 以 被 忽略 。 由 于 这 种 思想 ， 随 机 算法 首先 将 点 分 成 几 组 ， 使 得 各 组 内 
的 点 相互 之 间 相 隔 较 近 ， 然 后 ， 只 需 计算 同一 组 内 的 点 之 间 的 最 小 距离 。 

研究 图 11-1 中 的 六 个 点 。 如 果 将 这 六 个 点 分 成 三 组 : 5, = {x x2}, Sy = {x5 xo} AIS; = 
{x,, Xs}, HBA, RBSHR=TEB, dix, x), d&s, xdd, x). bia, 从 这 三 个 距 
离 中 找 出 最 小 者 即 可 。 如 果 没 有 将 这 些 点 分 成 组 ， 那 么 必须 计算 (6 . 5)/2 = 15 个 距离 。 

当然 ， 这 种 讨论 会 相当 令 人 误解 ， 因 为 不 能 保证 该 策略 会 起 作用 。 事 实 上 ， 这 种 策略 可 
看 作 是 分 而 不 治 策略 (divide-without-conquer strategy)。 存 在 划分 过 程 ， 但 是 没有 合并 过 程 。 
下 面 参见 图 11-2， 可 以 看 出 最 近 的 点 对 是 (x1，)。 但 是 ， 已 将 这 两 个 点 分 在 不 同 的 组 中 。 





图 11-1 点 的 划分 图 11-2 表明 组 内 部 距离 重要 性 的 一 种 情况 
如 果 将 整个 空间 划分 成 边 长 等 于 6 的 正方 形 ， 其 中 56 不 小 于 最 短 距离 。 那 么 ， 当 所 有 的 组 
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内 上 距离 计算 后 ， 可 以 使 正方 形 的 边 长 加 倍 ， 构 成 一 个 更 大 的 正方 形 ， 这 样 最 短 距 离 一 定 在 某 
个 扩展 后 的 方形 中 。 图 11-3 表 示 对 应 于 某 个 小 方形 扩展 后 的 四 个 大 方形 。 每 个 扩展 后 的 方形 
属于 -种 特定 的 类 型 ， 如 图 11-3 所 示 。 


of ete 


类 型 | 类 型 2 
类 型 3 类 型 4 


4 图 11-3 四 个 扩展 的 正方 形 的 构造 


设想 整个 空间 已 划分 成 若干 个 宽度 为 5 的 正方 形 ， 这 些 方形 的 扩展 产生 四 种 增 大 的 方形 集 
合 ， 对 应 于 类 型 1、 类 型 2、 类 型 3 和 类 型 4 分 别 表示 为 Ti\、T,、T; 和 7T,。 典 型 情况 如 图 11-4 所 示 。 
当然 ， 核 心 的 问题 是 找到 适当 的 网 格 大 小 


5。 如果 6 的 值 过 大 ， 那 么 最 初 的 方形 区 域 太 大 ， 

要 计算 大 量 的 距离 。 事 实 上 ， 当 6 的 值 太 大 时 ， 

问题 等 于 没有 划分 而 赔 变 成 原始 问题 。 另 -- 方 

面 ，6 值 也 不 能 太 小 ， 它 不 能 比 最 短 距离 还 小 。 . 

在 随机 算法 中 ， 随 机 选择 一 个 点 集 ， 找 到 这 些 F DT 


点 集 的 最 短 距 离 ， 令 这 个 最 短 距离 为 6。 


Am g 


d) 7, 





图 11-4 四 种 增 大 的 方形 


算法 11-1 寻找 最 近 点 对 的 随机 算法 

WA: BETER, a s PERS, EPS CR’, 
输出 ，5 中 的 最 近 点 对 。 ， 
步骤 1. 随机 选择 -个 集合 5S1 = fxn, xe, s Md FEHB man, 

找 出 S 中 的 最 近 点 对 ， 令 这 对 点 间 的 些 离 为 6。 
步骤 2. 构造 -个 边 长 为 6 的 方形 集合 7。 
步骤 3. 通过 员 倍 边 长 到 25， 由 7 构造 出 TI，T;，T; 和 克 四 类 方形 集合 。 
步骤 4. ETT. HRS. PEARS = SPUS UUS, <i<4， 其 中 51" 为 5 与 方形 区 域 7 的 非 空 交集 。 
步骤 5. 对 任 苞 x,。，x,ES， 计 算 dv， )。 令 志和 ww 是 在 这 些 点 对 中 路 离 最 短 的 点 对 。 返 回 最 近 点 对 Xx。 和 Xx。 o 


例 11-1 
给 出 有 27 个 点 的 集合 3y， 如 图 11-5 所 示 。 在 步骤 1 中 ， 随 机 选择 27° = 9 个 元 素 x;，x，，…， 


xo。 其 中 最 近 点 对 为 (x;，x,)。 在 步骤 2 中 ， 运 用 x, 和 x, 之 间 的 距离 5 作为 边 长 构造 36 个 符合 要 求 
的 方形 。 将 会 有 如 下 四 个 方形 集合 T,!，7T,;，T; 和 TT: 
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T, ={[0: 25, 0:26], [26:46, 0:26], [46: 66, 0:26], =, [48: 68, 46: 66]} 
T, = {[6: 36, 0: 26), [36:56, 0:26], =, (36:56, 46 :66}} 
T,={[0: 26, 6:36], (26:46, 6:36], [48: 68, 6:36], =, [46:66, 36: 56]} 









































T, = {[6: 36, 6:36], [36:56, 5:36], …, [36:56, 38:581} 

相互 距离 计算 的 总 数量 为 65 + 

N(T,): Cp +C} +C +C +C +C +C +C +C = 28 58 

N(T,): C +C? +C +C? 4+ C8 + Cf = 26 45 

N(T,): C$ +C} +C +C} +C} +C =24 3 站 

N(T,):C +C} +C +C =22 2 f- 

在 这 28 + 24 + 22 + 26 = 100 点 对 中 ， 最 近 的 一 对 在 “| 7 
[36: 58, 38: 56] 中 。 tS 2s 35 45 sê 6b 
11.2 随机 最 近 点 对 问题 的 平均 性 能 图 11-5 说 明 随 机 最 近 点 对 算法 的 例子 


在 上 节 所 介绍 的 随机 最 近 点 对 问题 中 ， 第 一 步 是 在 rn 个 点 中 找到 最 近 点 对 。 该 最 近 点 对 
2 2 4 
可 通过 递归 地 应 用 此 随机 算法 求解 。 也 就 是 ， 可 以 从 原始 点 集中 随机 选 出 (x?)? =n? 个 点 ,在 


n 个 点 集中 找到 最 近 点 对 。 可 以 使 用 直接 方法 进行 (5) =n? <n 次 距离 的 计算 。 但 是 ， 这 并 
不 意味 着 步 难 1 可 以 在 O(n) 时 间 内 执行 完毕 。 现 在 暂时 不 考虑 步骤 1 的 时 间 复 杂 度 ， 随 后 证 明 
步骤 1 的 确 只 花费 O(n) 的 时 间 。 

显然 ， 步 又 2 和 步骤 3 能 够 在 0(m) 的 时 间 内 执行 完毕 。 步 又 4 可 以 利用 散 列 技术 。 利 用 散 列 
技术 容易 地 确定 哪个 点 位 于 特定 的 方形 中 ， 这 意味 着 步骤 4 在 时 间 0(n) 内 计算 完毕 。 

步骤 5 中 期 望 的 距离 计算 次 数 绝 不 是 能 容易 地 确定 下 来 的 。 事 实 上 ， 并 没有 计算 距离 期 户 


次 数 的 公式 。 确 实 ， 我 们 能 证 明 在 步骤 5 中 ， 距 离 计 算 总 数 的 期 望 值 的 概率 为 1- 2e-” ， 随 着 
n 增 大 ， 访 概率 能 快速 地 接近 1。 或 者 ， 从 另 一 角度 来 说 ， 在 O(n) 时 间 内 计算 出 距离 总 数 期 望 
值 的 概率 是 非常 高 的 。 

为 什么 能 得 出 上 述 的 结论 ? 注意 在 随机 最 近 点 对 算法 中 ， 方 形 边 长 为 6， 用 7 表示 该 划分 ， 
且 对 该 划分 所 需 计 算 的 距离 总 数 为 NI 。 接 下 来 证 明 存 在 一 个 特殊 的 划分 称 为 To， 边 长 为 6， 
有 以 下 两 个 性 质 ， 

(1) n<MT,) «< Con。 


(2) ô< V2 6 的 概率 为 1-2e-” ， 此 概率 非常 高 。 
我 们 之 后 会 解释 该 划分 的 存在 原因 。 首 先 假定 它 是 正确 的 ， 并 从 这 里 开始 推导 。 
假定 将 方形 边 长 从 & 扩大 四 倍 到 46, ,扩大 四 倍 导致 16 个 方形 集合 , 将 它们 表示 为 T,(i = 1， 


2，.…，16)。 由 于 6< V26, 的 概率 为 1- 2e-”“， 那 么 T 中 任意 方形 至 少 属于 T,(i = 1，2，…，16) 
中 一 个 的 概率 为 1- 2e-“ 。 对 于 划分 T 中 距离 计算 的 总 数 为 N(T,)， 那 么 


16 
N(T)< > Ma) 


为 真 的 概率 为 1-2. 
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现在 计算 NT)。 从 N(T, FH, TET, 中 每 个 方形 是 Ti 中 方形 的 16 倍 ， 令 Tu 中 内 部 元 素 最 多 
的 方形 有 k 个 元 素 ，5; 表示 ,中 16 个 方形 集合 属于 7 中 的 第 /个 方形 区 域 ， 令 在 5; 中 拥有 最 多 元 
素 的 区 域 最 多 有 夕 个 元 素 ， 那 么 Ti 中 距离 计算 的 总 数 比 Sky ky 一 /2 大 ， 也 就 是 (ky 一 D12 


SNT) < Con, FFA, T, 中 第 / 个 方形 距离 计算 的 总 数 小 于 16k; (16k, 一 1)/2。 因 此 ， N(T; )< 
È 16k, (6k, -12<Cin， 其 中 为 常数 。 所 以 ，NCT)< 六 NG = O(n) 的 概率 为 1-2e 。 


由 于 n 很 大 ，e-” 快速 缩减 为 9%， 所 以 N(T) < O(n) 的 概率 为 1。 


接 下 来 ， 将 解释 为 什么 能 得 出 存在 具有 以 上 两 种 性 质 的 划分 结论 。 原 因 是 很 复杂 的 ， 在 
给 出 主要 论证 前 ， 先 定义 一 些 术 语 。 

令 D 为 点 集 的 一 个 划分 ， 也 就 是 ，8 = SIUSU…US3, 且 当 ix#j 时 ，8 OS = 加 MRT SSE 
mm 个 元 素 的 一 种 选择 ， 那 么 当 T 中 至 少 有 两 个 元 素 是 从 某 个 i 的 划分 的 同一 部 分 5; 中 选 出 的 ， 那 
么 称 T 是 D 的 一 个 后 继 (success)。 如 果 D' 是 5 的 另 一 种 划分 ， 如 果 对 于 任意 的 m，D 中 拥有 m 个 
元 素 的 后 继 的 概率 大 于 或 等 于 在 D' 上 有 m 个 元 素 的 后 继 ， 那 么 称 D 支 配 D'。 

根据 上 面 的 定义 ， 易 见 下 面 的 陈述 是 正确 的 : 

(1) 划分 (2，2，2) 支 配 ( 3 ，1，1，1)。 这 意味 着 有 六 个 元 素 的 集合 划分 成 3 部 分 的 所 有 划 
分 法 均 优 于 将 同样 的 集合 分 成 一 个 3 和 3 个 单数 1 的 划分 。 为 什么 能 支配 ? 理由 很 简单 。 对 于 划 
分 (2，2，2)， 从 同一 方形 中 选 出 2 个 点 的 概率 远 比 划分 (3，1，1，1) 大 得 多 ， 后 者 仅 有 一 个 方 
形 多 于 1 个 元 素 。 

(2) 划分 (3，3) 支配 (4，1，1)。 

(3) 划分 (4，4) ZAGS, 1, 1, D. 

(4) HFE, qa) (P25, q>5), ZECU, 1, 1,0, D, A RIDT Ap +q, (1)< 
P(p—!) + gq(g—l) <1 +1, 

由 此 可 见 ， 如 果 划 分 D 支 配 D'， 那 么 D' 所 需 计算 的 距离 总 数 小 于 等 于 D 计 算 的 距离 数 。 

令 N(D) 为 D 中 所 需 计 算 的 距离 总 数 ， 由 前 面 的 定义 和 讨论 可 知 ， 显 然 对 有 限 点 集合 5 的 每 
一 个 划分 D， 存 在 一 个 同样 集合 的 划分 D'， 使 得 AN(D)<N(D')， 其 中 D 支 配 D'， 并 且 D' 的 所 有 
子 集中 除去 1 个 外 全 为 单元 素 集合 ，4 是 一 个 小 于 或 等 于 1 的 正 数 。 

假定 D 是 集合 5，1S1 = n 且 n <N(D) 的 一 个 划分 ， 那 么 令 DD' 为 一 个 划分 使 得 $ = HUHU 
UH., FADPR XAG, HIHI =b, HI= 1 i=2, 3, 0, k, An<N(D'), xR HAns bb- 
1)/2, WAb> V2ån, Sc= V24, Ab>cyn. 


SE A — AEE, AOR RAH HERRERA] —bin<1—cl Vn。 假设 n MAES 
中 随机 选 出 的 ， 那 么 它们 都 不 是 从 五 ,中选 出 的 概率 小 于 


ey em 
(1-7) -|(-7) jr 


AS? Mk n 个 点 时 ， 至少 有 两 个 点 来 自 于 本 ,的 概率 大 于 1-20, HEDARD', 
可 以 推出 ， 如 果 点 是 从 8 中 随机 选 出 的 ， 那 么 有 两 个 点 来 自 于 万 的 同一 个 集合 的 概率 至 少 为 


t 


AD = 1-2, PCH EK, 
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仍 有 一 个 问题 尚 待 解决 ， 划 分 To 是 否 满足 a 和 NGIWS<Cw， 其 中 Co 为 常数 ? 这 个 划分 可 通 
过 下 面 的 算法 建立 。 


算法 11-2 划分 算法 
WA. 有 7 个 点 的 集合 8。 
输出 : RTI En <S MT) S con。 
步骤 1. 找 出 划分 7， 其 网 格 恰好 使 7 中 的 每 个 方形 区 . 域 至 多 包含 5 中 的 一 个 点 ， 且 5 中 没有 点 在 网 格 线 二 ， 因 此 ， 
N(T) = 0。 
步骤 2. AN(7)<n 上 时 ， 冯 倍 扩 大 7 网 格 的 规模 。 


现在 解释 算法 11-2 的 含义 。 算 法 的 第 一 步 将 整个 点 集 划分 成 正方 形 区 域 ， 使 得 每 个 方形 
区 域 中 至 多 有 一 个 点 。 显 然 ， 在 这 种 情况 下 ，N(7) 为 0， 对 我 们 毫 无 用 处 。 所 以 ， 需 要 逐渐 地 
加 们 方形 的 大 小 ， 直 到 遇 到 算法 11-1 的 第 一 次 划分 使 得 N(n) 之 为 止 。 

考虑 如 图 11-6 所 示 的 例子 ， 其 中 n = 10。 图 11-6a 显 示 最 初 的 划分 ， 即 步骤 1 的 结果 ， 现 在 
使 网 格 扩 大 1 倍 ， 得 到 如 图 11-6b 所 示 的 划分 。 现 在 ， 总 共 所 需 计算 的 距离 总 数 为 N(7T) = 4 x 3/2 
+2xl2+4x32=6+1+6=13>1= 10。 因 此 ， 这 个 特殊 的 划分 是 满足 要 求 的 T,。 注 意 在 
此 例 中 ， Co= 1.3。 














a) 


图 11-6 说 明 算法 11-1 的 例子 


令 6 表 示 To 的 网 格 边 长 ， 那 么 对 任意 选 出 壮 点 的 集合 5, , WRS, 中 存在 两 个 点 在 To 中 的 
同一 方形 区 域 中 ， 那 么 8. 中 的 最 小 距离 小 于 或 等 于 V2 6， 不 等 式 成 立 的 概率 大 于 AD。 至 此 ， 
已 经 证 明 ， 存 在 特殊 的 Po， 其 大 小 为 8%， 且 有 如 下 两 个 性 质 : 

(1) n<MTy)<Con, 


(2) ô< V2 5 的 概率 为 1- 2e-” ， 概 率 非常 高 ， 其 中 6 为 mi 个 随机 选 出 点 集 的 最 短 距离 。 
现在 解释 算法 11-1 中 步 又 5 只 需 0(m) 步 。 注 意 步骤 1 是 递归 的 。 但 是 ， 因 为 步骤 5 是 最 重要 
的 一 步 ， 可 以 得 出 整个 随机 查找 最 临近 点 对 算法 的 时 间 复 杂 度 为 O(n)。 


11.3 索 数 测试 的 随机 算法 


素数 问题 (prime number problem) 是 确定 一 个 给 定 的 正 数 是 否 素数 。 这 是 一 个 很 难 的 问 
题 ， 直 到 2004 年 还 没有 出 现 多 项 式 时 间 复 杂 度 的 算法 来 解决 该 问题 。 在 本 节 中 ， 将 介绍 一 种 
随机 算法 ， 该 随机 算法 执行 一 系列 m 次 的 测试 。 如 果 这 些 测 试 中 任意 一 次 成 功 ， 那 么 可 推断 其 
为 合 数 ， 且 能 保证 该 结论 是 绝对 正确 的 。 另 一 方面 ， 如 果 所 有 m 次 测试 全 都 失败 ， 那 么 可 推断 
这 个 数 为 素数 。 但 这 次 不 能 确保 一 定 是 正确 的 。 结 论 正确 的 概率 为 1 -2“”。 因 此 ， 如 果 m 足 够 
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大 ， 可 以 有 足够 的 信心 得 出 该 推断 。 


算法 11-3 ”随机 素数 测试 算法 
WA: 正 数 N， 参 数 m， 其 中 m> [log:e] 。 
输出 ，N 是 否 素数 ， 且 正确 的 概率 为 1-e = 1-2“。 
步骤 1. 随机 地 选 出 m 个 数 b， b,, my bns I<b,, b,, ae bn<N, 
步骤 2. 对 每 个 b;， 测 试 W(b;) 是 否 成 立 ， 其 中 Wb;) 定 义 如 下 : 
Do ne 或 者 
(2) 7, 使 得 1 -人 为 整数 ， 以 -1 和 AN 的 最 大 公约 数 小 于 N 大 于 1。 
sowie 那么 返回 N 为 合 数 ， 否 则 ， 返 回 N 为 素数 。 


现在 通过 一 些 例子 说 明 该 随机 算法 ， 考 虚 N = 12， 假 定 选择 2，3 和 7。2'*' = 204841 
mod 12。 由 此 ， 我 们 推断 出 12 为 合 数 。 

考虑 N = 11， 假 定 选择 2、5 和 7。 

b =2:2'''=1024=1 mod 11, 

令 j = 1。(N-1)/2 = (11-1)/2' = 10/2 =5, 

此 j= 1 是 使 (N 一 1)/2 为 整数 仅 有 的 j。 

BÆ, 25-1 = 31 和 11 的 最 大 公约 数 为 1。 

W(2) 不 成 立 。 

b=5:5"!=5"=9765625=1 mod 11, 

由 上 面 的 讨论 ， 该 7 = 1 是 使 (N 一 1)/2 = 上 = 5 为 整数 的 j。 

bk = 55 =3 125 

5S—1=3 124 和 11 的 最 大 公约 数 为 11。 

W(5) 也 不 成 立 。 

b,=7: re 249 =1 mod 11, 

同 理 ， 令 j= 

bt=7;=16 807 

75-1 = 16 806 和 11 的 最 大 公约 数 为 1。 

W(7) 也 不 成 立 。 

可 以 推论 11 为 素数 ， 且 正确 的 概率 为 1-2 = 1-1/8 = 7/8。 

如 果 还 选择 3， 那 么 同样 可 证 W(3) 也 不 成 立 。 现 在 m = 4， 那 么 正确 的 概率 增 至 1-2“ = 
15/16, 

对 于 任意 的 NY， 如 果 m 为 10， 那 么 正确 的 概率 为 1~2“"， 几 平 为 1。 

这 个 随机 素数 测试 算法 的 正确 性 基于 下 面 的 定理 。 

定理 11-1 

Ce CA 那么 N 为 合 数 。 


(2) MRNAS, i -1 loll <b<N, W(b) RIT}, 


由 上 面 的 定理 ， ec: 那么 至 少 一 半 的 b,(b; <N) 使 W(bi) 成 立 。 如 果 存 在 一 个 b, 使 
得 W(bi) 成 立 ， 那 么 N 一 定 为 合 数 。 如 果 对 于 m 个 b;，W(b;) 都 不 成 立 ， 那 么 根据 定理 11-1，NN 为 


合 数 的 概率 为 Gy. 因此 ，N 为 素数 的 概率 大 于 1--2-"。 
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11.4 模式 匹配 的 随机 算法 


在 本 节 中 ， 将 介绍 随机 模式 匹配 算法 (randomized pattern matching algorithm), ZR 
用 来 解决 下 述 问 题 ， 给 定 长 度 为 4 的 模式 串 X 和 长 度 为 m(m 之 n) 的 文本 串 Y， 找 出 作为 Y 的 连续 
子 串 X 的 第 一 次 出 现 的 位 置 。 不 失 一 般 性 ， 假 定 X 和 了 都 是 二 进 制 串 。 

例如 ， 令 X=01001,，Y= 1010100111。 可 见 X 确 实 出 现在 7 中， 如 下 划 线 所 示 。 

令 模 式 X 和 7 分 别 为 

X=x,x,°'x,, x,E{0, 1} 

F Y= yY Ym, Yi E{O, 1}. 

DY) = yY Yn YD =YV Yna EH. RE, AYO = ViVi Vini 那么 对 于 某 个 
i， 如 果 X = Y(i)， 那 么 匹配 出 现 。 

存在 另 一 种 检验 X 和 Zi) 的 方法 。 令 串 s 的 二 进 制 值 为 BCs)， 那 么 

BCX) = x2"! +x.2"7? ++ +x,, 及 

BUY) =yj2" H yi"? + XG L<i<m—n+l, Ak, RRRRBORE STAY). 

麻烦 在 于 当 n 很 大 时 ，B(X) 与 8(Y, ) 的 计算 将 变 得 很 困难 。 因 此 ， 将 提供 一 种 随机 算法 来 解 
决 这 个 问题 。 因 为 是 随机 算法 ， 所 以 有 可 能 造成 错误 。 

该 方法 是 计算 B(X) 除 以 素数 P 的 余数 。 令 整数 x 和 v 的 余数 为 (u), TAR, 1B), #(BY;)), 
Bt, XY， 但 反之 不 然 。 例 如 ， 考 虑 X= 10110， 了 = 10011， 那 么 

B(X=2+2+2'=16+4+2=22 

B( ZI=24+2+20=16+2+1=19 

4P=3, BA, (B(X)), =(22);=1, (BY), = (19) =1., REBO), = (BO), ， 但 是 仍 不 
能 断定 X = Yi). 

该 随机 算法 由 以 下 思想 组 成 ， 

(1) AEDES., Po > Pro 

(2) 如 果 对 任意 的 j， 有 (B8(X))p; #(B(Y,))p;, BAX # Yi). 

对 于 j= 1，2，…，K， 如 果 (B(CO)P) = (B(Y,)) p;， 那 么 推断 X= YC). 

我 们 将 说 明 ， 如 果 推 论 是 X 关 了 CD， 那么 是 绝对 正确 的 ， 另 一 方面 ， 如 果 推 论 为 X = Yi), 
那么 有 可 能 做 出 错误 的 结论 。 

XARRI TE F (BOO), ABO 计算 简便 ， 实 际 上 无 需 计算 B(X) SBY). 回忆 

BCX) = x,2"' + X22 + + x, 

5h 

(B(X;)), = (Ce, + 2), + x2) © 2)p + x3) * 2+ 

类 似 地 ， 

BOD, = (C(O; © 2p + Yia) 2p tyis2), * 2+ 

采用 这 种 机 制 ， 无 需 担 心 8(X) 或 B(Y(i)) 是 否 大 数 。 现 举例 说 明 该 点 。 

令 X= 10110 
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(Xi 2) = (1 “ 2); =(2),=2 

(2 + x2), = (2 +0), = (2); =2 

(2+ 2),=(4),=1 
(1+), =(1 + 1); = (2); =2 

(2+ 2),=(4),=1 

(1 + x4), = (1 + 1); = (2); = 2 

(2+ 2),=(4);=1 

(1 +x,),= (1 +0); = (1), =1 

即 (B(X)), = (BX) = 1 

可 见 通过 这 种 计算 ， 所 有 涉及 的 数 都 相对 较 小 。 
接 下 来 ， 给 出 模式 匹配 的 随机 算法 。 


算法 11-4 模式 匹配 的 随机 算法 


输入 : 模式 串 X = xr ， 文本 串 Y = yvr Yn 及 参数 。 
输出 : (DA, YH RAT RY, 
(2), YO = Vie Yia n- PEREX 
如 果 答 案 为 “ 否 "， 那 么 无 错 。 
如 果 答 案 为 “是 ”， 那 么 可 能 以 某 个 概率 出 错 。 
PRI ML, 2, o, nf}, t= m+n~1 中 随机 选 出 k 个 素数 p,，p;，…，pi 。 
步骤 2. i = !。 
步骤 3./ = 1。 
步骤 4. 如 果 (Bp, BO), MARFA RS, 
如 果 7=K， 返 酉 XD 作 为 答案 
j=j+1 
HIP. 
PMS. toRi=c, eel “G, Ve EA fR peA” 
i=i+1。 


HIFR, 


HE, MMAR. BAL, TEREA, A R eE 
是 非常 小 的 。 

也 许 会 问 : 当 产 生 一 个 错误 结果 时 ， 发 生 了 什么 ? 当 得 出 错误 的 结果 时 ， 有 以 下 条 件 : 

(1) B(X) # B(Y;) 

(2) MHj=1, 2, ++, k， 均 有 (B(X))p) = (BUY; ))p, 

由 于 上 述 条 件 ， 可 以 得 出 


B(X) = a;p;+ ¢; (11-1) 
B(Y;) = bpj+ c; (11-2) 
因此 ， B(X)—B(Y,) = (a; —b, )p; (11-3) 


FA (11-3) AAPA, BOXO-BY,) +0 Hp, 能 整除 B(X)-B(Y,) 时 ， 会 产生 错误 结论 。 
现在 提出 一 个 实质 性 的 问题 : 有 多 少 个 素数 能 够 整除 | BCX) 一 B(Y(i))1? 
为 了 回答 这 个 问题 ， 给 出 一 个 n 比 特 的 模式 X 和 mm 比特 的 文本 ， 令 8 表示 下 面 的 积 


kam-n+l 


] [B0 -Bro 


i 


其 中 p; 能 整除 IB(X) 一 8B(Y(2))1。 
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注意 p; 也 能 整除 Q。 

Q 的 值 小 于 2””“*n"。 有 了 这 个 值 ， 就 能 确定 出 错 的 概率 ， 需 要 下 面 的 声明 : 

如 果 u 之 29 且 a 之 2" ， 那 么 与 4 相 凡 的 素数 约 数 个 数 小 于 (wu)， 其 中 WW) 表 示 小 于 4 的 素数 个 
数 。 

我 们 并 不 详细 证 明 上 述 声明 是 如 何 得 出 的 。 为 了 利用 上 述 声 明 ， 注意 8 小 于 2”” ”一 2” ， 
因此 ， 如 果 nt 宇 29， 那 么 8 的 相 异 素数 约 数 个 数 少 于 zt(n7)。 

在 算法 中 ，p, 是 从 {1 ，2，…，nf} 中 选 出 的 一 个 素数 。 因 此 ，p; 能 整除 8 的 概率 小 于 
Mnt)/a(nf)。 这 意味 着 p, 给 出 错误 结论 的 概率 小 于 zx(nnD/a(nf)。 因 此 ， 当 选 出 k 个 素数 时 ， 那 
么 做 出 错误 结论 的 概率 取决 于 这 些 数据 ， 将 少 于 (znD/nnf2)》 。 

讨论 的 总 结 如 下 : 

对 于 该 随机 模式 匹配 算法 ， 如 果 选 出 kK 个 不 同 的 素数 ， 当 n1 之 29 时 ， 那么 做 出 错误 结论 的 
WAD F nAn , 

下 一 个 回 题 是 : 如 何 估算 xz? 有 如 下 估算 公式 : 

SATA Hu > 17， 


4 <m(u)<1.255 06 4 
in u Inu 


一 般 地 ， 即 使 :不 是 很 大 ， 做 出 错误 结论 的 概论 也 相当 得 小 。 
BREnt 229, WA 
m(nt) <1.255 06 tt nt In(at*) 
(nt?) Innt n? 
- 1.255 06 | In(nt? ] 
t In(nt) 
_ 1.25506 (= + aa 
O In(nt) 


_ 1.255 06 [ + In(t) 
t In(nt) 














例如 ， 令 n= 104m = 100， 那 么 := 91。 
mnt) — 1.255 06 ee (i+ Int 








mnt? jS t ln(nt) 
eee (14 saD) 
91 ln(910) 





=0.013 7 4510 z) 


6.8134 
= 0.013 792- (1 + 0.662 1) 
= 0.013 792 -1.6621 
=0.0229 
假定 x = 4， 那 么 得 出 错误 结论 的 概率 为 
(0.022 9)*=2.75*107 
这 是 非常 非常 小 的 
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11.5 交互 证 明 的 随机 算法 


考虑 以 下 问题 。 在 冷战 时 期 ， 一 名 英国 的 MIS (Military Intelligence Unit 5， 即 第 五 军事 
情报 组 织 ， 参 考 P Wright 的 《Spy Catcher) (情报 捕手 ) ) 特工 想 与 一 名 已 被 她 的 最 高 政府 在 
KGB 培 训 数 年 的 间谍 联系 。 

令 该 MI5 特 工 为 B， 而 在 KGB 中 培训 过 的 间谍 为 4。 现 在 的 问题 是 ， B 怎 样 知道 4 就 是 真正 
的 4， 而 不 是 其 他 的 KGB 的 冒充 者 。 一 种 简单 的 方法 是 问 4 的 娘家 姓 。 但 麻烦 的 是 ， 如 果 A 回 
答 正 确 ， 那 么 一 些 KGB 工 作 人 员 在 下 一 次 能 很 容易 地 冒充 4。 因此 ，B 必 须 让 A 做 些 相 当 困 难 
的 事 , 这 些 事 的 难度 是 普通 人 难以 胜任 的 。 例 如 ， 他 可 以 让 4 判断 一 个 布尔 表达 式 的 可 满足 性 。 
假定 4 足够 聪明 ， 知 道 怎么 漂亮 地 解决 该 NP 完全 问题 。 因 此 ， 当 他 每 次 从 B 处 得 到 一 个 布尔 表 
达 式 ， 他 解答 出 该 问题 。 如 果 表 达 式 是 可 满足 的 ,他 给 8 发 送 一 个 赋值 ， 而 表达 式 不 可 满足 时 ， 
仅 发 送 “NO”。B 不 需要 很 聪明 ， 他 只 需 知 道 可 满足 性 的 定义 ， 至 少 可 以 检查 赋值 是 否 满足 表 
达 式 ， 如 果 4 每 次 都 正确 地 解决 了 可 满足 性 问题 ， 那 么 B 会 很 高 兴 ， 并 确信 4 就 是 真正 的 4。 

但 是 ， 一 名 窃听 者 可 能 逐步 发 现 B 总 是 发 送 布尔 表达 式 给 4， 并 且 ， 如 果 该 公式 是 满足 
的 ， 那 么 4 发 送 可 满足 的 答案 给 BB。 这 个 窗 昕 者 开始 研究 这 种 机 械 的 定理 证 明 方 法 ， 他 迟早 
能 假扮 4。 

可 以 说 4 和 8B 都 太 容易 造成 泄密 。 下 面 的 方法 可 能 更 好 些 ，B 发 送 给 A 一 些 信 息 后 ，4 先 对 
数据 作 一 些 计算 再 给 8 发 送 回 结果 数据 。 这 样 ，B 需 作 相 应 的 计算 后 验证 4 的 结果 。 如 果 符 合 ， 
那么 他 可 确信 4 是 正确 的 人 。 通 过 这 种 方法 ， 窃 听 者 仍 能 截 走 一 些 数据 ， 但 对 他 而 言 ， 很 难 明 
白 接 下 来 的 事 。 

在 本 节 中 ， 将 说 明 B 要 求 4 解决 二 次 非 剩 余 问 题 (quadratic non-residue problem) ， 并 且 有 
趣 地 看 到 数据 在 来 回 传 送 过 程 中 ， 没 有 泄露 太 多 的 信息 。 当 然 ， 由 于 是 随机 算法 ， 它 包含 一 
定 程度 的 允许 误差 。 

邻 Xx 与 y 为 两 个 正 整 数 ，0<y<x， 使 得 gcd(x,y) = 1。 定 义 Z, = {zi0<z<x, gcd(z, x) = 1}。 
如 果 对 某 些 zEZ, 有 y =z mod x， 称 y 为 模 Xx 的 二 次 剩余 ; 否则 称 为 模 x 的 二 次 非 剩余 。 进 一 步 定 
义 两 个 集合 : 

OR = {(x，y) 1y 是 模 x 的 二 次 剩余 } 

QNR < {(x，y) 1y 是 模 x 的 二 次 非 剩余 } 

例如 ， 设 y = 4 且 x = 13。 显 然 ， 存 在 z， 也 就 是 2， 满 足 zEZ. My = z mod x 《容易 验证 : 
4 = 2? mod 13)。 因 此 ，4 为 模 13 的 二 次 剩余 ， 同 理 能 证 明 8 为 模 x 的 二 次 非 剩余 。 

现在 ，B 与 4 怎样 进行 通信 使 得 4 能 为 8 解决 二 次 非 剩余 问题 而 不 港 露 太 多 信息 ? 

他 们 执行 过 程 如 下 : 

(1) 4 与 8 都 知道 x 的 值 ， 且 保守 该 秘密 ，B 知 道 y 的 值 。 

(2) B 的 行为 ; 

(a) 抛 硬币 ， 获 得 m 比 特 : b,，b，,，，…，b,, ， 其 中 加 为 x 的 二 进 制 表 示 的 长 度 。 

(b) 对 所 有 的 i， 找 出 z/，z2.，…，zm，0<z <x， 使 得 gcd(z; ,XxX) = 1。 

(c) 按 如 下 方法 由 Bi,， ba, cs Ons Zo Zs 5 zw 计算 出 w， Way ois wn 的 值 : 
如 果 b; =0， 那 么 w; =z? mod x, 
mb, = 1， 那 么 w; =(? > y) mod x, 

(d) fwi, Wz, s, Wn 发送 给 A。 

(3) 4 的 行为 : 
(a) 从 B 处 接收 wl，w,，- …，w。 
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(b) 按 如 下 方法 ， 置 c,， c，…，cn 如 下 : 
如 果 (x，w;)EQR， 那 么 c; = 0。 
如 果 (x，w;)EQNR， 那 么 c; =l, 
(c) 将 c1/，c;,，…，c 发送 给 B。 
(4) B 的 行为 ; 
(a) 从 4 处 接收 cj，cz，…，cn。 
(b) 对 于 所 有 的 i， 如 果 b，= c; ， 那 么 返回 “是 ，y 为 模 x 的 二 次 非 剩 余 ”， 否则 返回 
“ 否 ，y 为 模 x 的 二 次 剩余 ”。 
可 以 证 明 ， 如 果 y 为 模 x 的 二 交 非 剩余 ， 那 和 勾 B 以 概率 1 一 2 “接收 它 ; 如 果 y 为 模 x 的 二 次 剩 


余 ， 那 么 B 以 概率 2 “接收 它 。 





8 能 够 通过 重复 该 过 程 减少 出 错 。 注 意 4 必 须 是 足够 聪明 的 人 ， 能 够 解决 二 次 非 剩 余 问题 。 
因此 ，4 是 一 个 “证 明 者 ”， 而 8 是 一 个 “验证 者 ”。 
现在 给 出 一 些 例 子 。 
假定 (x, y)=(13, 8), kl=4, 
8 的 行为 : 
(a) 假定 bi, bz, b3, b4=1, 0, 1, 0, 
(b) RZ, 22» Zs, %=9, 4, 7, 10, ENIAM Fx = 13 都 与 xz 互 质 。 
(C) w，wz，…，wn 计 算 如 下 : 
b,=1, w,=(2? + y) mod x = (9? - 8) mod 13 = 648 mod 13 = 11 
b,=0, w= (z2) mod x = 4? mod 13 = 16 mod 13 =3 
b,=1, w,=(27- y) mod x = (7° - 8) mod 13 = 392 mod 13 = 2 
b,=0, w,=( 22) mod x = 10? mod 13 = 100 mod 13 = 9 
WE, (wi, wo, w was) = (il, 3, 2, 9). 
(d) #11, 3, 2, 9) 发 送 给 4。 
A 的 行为 ， 
(a) 从 B 处 接收 (11，3，2，9)。 
(b) (13, 11)EQNR, c,=1, 
(13, 3)EQR, c,=9, 
(13, 2)EQNR, c,=1, 
(13, 9)EQR, c,=0, 
(c) Hci, cz, C3, cy =(1, 0, 1, 0) 发 送 给 B。 
B 的 行为 ， 
对 所 有 的 i， 均 有 b; = c; ，B 接 收 到 的 是 8 为 模 13 的 二 次 非 剩余 ， 此 为 真 。 
现在 看 另 一 个 例子 。 
(x, y)=(13, 4), bel = 4。 
BRITA: 
(a) 假定 b,, bz, ba, ba=1, 0, 1, 0, 
(b) REZ, Z2, Zs, %=9, 4, 7, 10, 
(c) HAW, w w, Wa) = (12, 3, 1, 9). 
(d) 将 (12，3，1，9) 发 送 给 4。 
A 的 行为 ， 
(a) 从 B 处 接收 (12，3，1，9)。 
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(b) (13, 12)EQR, c,=0, 
(13, 3)EQR, c,=0, 
(13, DEQR, c,=0, 
(13, WEQR, c,=0, 
(c) 将 (0，0，0，0) 发 送 给 B。 
BRITA: 
由 于 对 所 有 的 ;， 并 非 记 = c; ，B 接 收 到 的 事实 是 4 为 模 13 的 二 次 剩余 。 
该 随机 算法 的 理论 基础 是 数论 ， 超 出 了 本 书 的 讨论 范围 。 


11.6 最 小 生成 树 的 随机 线性 时 间 算 法 


在 第 3 章 中 ， 介 绍 了 基于 贪心 法 的 两 种 最 小 生成 树 算法 。 这 些 树 算法 其 中 之 一 是 
Kruskal 算 法 ， 其 时 间 复 杂 度 为 O(n log n)， 另 一 种 算法 为 Prim 算 法 ,该 算法 复杂 版 本 的 时 
间 复 杂 度 为 O(n+tma(m，n))， 其 中 n(m) 为 该 图 中 的 顶点 ( 边 ) 的 个 数 ， 而 a(m， nÆ i 
曼 函 数 的 逆 函 数 。 在 本 节 中 ， 将 介绍 一 种 随机 的 最 小 生成 树 算法 ， 其 期 望 的 时 间 复 杂 度 是 
O(n +m), 

YRS v7 1926 hBoruvkafp të HAP ABoruvkat Re E. Pm BARR 
Boruvka 步 骤 背 后 的 思想 。 

引 理 1: SV AV AAES MAR, VU, = Y 且 Vinw = 6, 边 ("， 力 为 最 小 权重 的 边 ， 


引 理 1 可 以 用 另 一 种 方式 描述 如 下 : 在 图 G 中 ， 对 任 一 结 点 4， 在 所 有 与 点 u 邻 接 的 边 
中 ， 如 果 边 (v，) 为 最 小 权重 的 边 ， 那 么 ，(v， 忆 一 定 是 图 G 中 的 最 小 生成 树 中 的 一 条 边 。 
很 容易 证 明 引 理 1， 参 见 图 11-7， 对 结 点 c<， 在 所 有 邻接 到 结 点 c 的 边 中 ， 边 (c，e) 权 重 最 
小 ， 所 以 ， 边 (c，e) 必 包含 于 图 G 的 最 小 生成 树 中 。 同 样 地 ， 很 容易 证 明 边 YF，g) 也 包含 于 
其 中 。 

现在 ， 运 用 引 理 1 选择 出 图 11-7 中 所 有 包含 在 最 小 生成 树 中 的 边 ， 最 终 不 同 的 连通 分 支 如 
图 11-8 所 示 ， 在 图 11-8 中 ， 所 有 虚线 为 连通 分 支边 。 





图 11-7 一 个 图 图 11-8 在 Boruvka 步 允 中 边 的 选择 


我 们 可 将 每 个 连通 分 支 中 的 结 点 压缩 成 一 个 结 点 ， 现 有 五 个 结 点 ， 如 图 11-9 所 示 。 消 除 
多 余 重复 边 和 回路 后 ， 结 果 如 图 11-10 所 示 。 

由 于 得 到 的 图 由 多 于 一 个 的 结 点 组 成 ， 所 以 ， 再 次 应 用 引 理 1， 结 果 如 图 11-11 所 示 ， 被 
EEN Aa, d), (c, DA, h). 

将 每 个 连通 分 支 缩 成 一 个 结 点 后 ， 得 到 两 个 结 点 ， 如 图 11-12 所 示 。 
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图 11-10 第 一 次 运用 Boruvka 步 又 的 结果 
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abcdeilmn 
Sghjk 
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图 11-11 边 的 第 二 次 选择 图 11-12 边 的 第 二 次 构造 


le, RE RED, HRW, hla, AMARA Mem, RR. M 
有 被 选择 构成 最 小 生成 树 的 边 如 图 11-13 所 示 。 








图 11-13 运用 Boruvka 步 骤 获 得 的 最 小 生成 树 


寻找 最 小 生成 树 的 Boruvka 算 法 是 递归 运用 Boruvka 步 骤 直 到 最 终生 成 的 图 成 为 单独 的 一 
> SBoruvkat RMA AAG, E), SiIHARIG(V', E), Boruvkat- Sead aT . 
Bofruvka 步 又 


1. 对 每 个 结 点 4， 找 出 与 它 关联 的 最 小 权重 边 (n，v)， 找 出 由 此 标记 的 边 确定 的 所 有 连通 
分 支 。 
2. 将 由 标记 边 确 定 下 来 的 每 个 连通 分 支 压 缩 成 一 个 顶点 ， 令 产生 的 图 为 GCC(Y ， 严 )， 并 消 
除 重复 边 和 回路 。 
一 次 Boruvka 步 又 的 时 间 复 杂 度 为 O(n + m)， 其 中 IVi=n, IE| = m。 由 于 G 是 连通 的 ,，m>n， 
所 以 O(n + m) = OGm)。 因 为 由 标记 边 所 确定 下 来 的 每 个 连通 分 支 至 少 包含 两 个 点 ， 在 每 次 
Boruvka 步 又 执行 后 ， 剩 余 的 边 比 原始 的 边 至 少 要 减少 一 半 。 因 此 ，Boruvka 步 又 执行 的 总 次 
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数 为 O(log n)， 这 样 ，Boruvka 算 法 的 总 时 间 复 杂 度 为 O(m log n). 

为 了 更 有 效 地 运用 Boruvka 步 骤 ， 必 须 使 用 一 个 新 概念 ， 参 见 图 11-14。 在 图 11-14b 中 ,图 
G, 是 图 11-14a 中 图 G 的 子 图 。G, 的 最 小 生成 森林 FF 如 图 11-14c 所 示 。 在 图 11-14d 中 ， 最 小 生成 
森林 大 隐藏 在 原始 图 G 中 。 所 有 不 在 F 中 的 边 用 虚线 标记 。 考 虑 边 (e， 户 ， 边 (e， 乃 的 权重 为 7。 
因此 。 在 森林 FF 中， 在 e 至 /之 间 有 一 条 路 径 ， 即 (e，d) 一 (d，8) 一 (8， 用 。 边 (e,， 内 的 权重 大 于 该 
路 径 中 的 边 的 最 大 权重 。 由 下 面 的 一 条 引 理 可 知 ， 边 (e， 乃 不 是 G 的 最 小 生成 树 中 的 边 。 在 介 
绍 引 理 之 前 ， 先 定义 一 个 称 为 F 重 的 (F-heavy) 术语 。 

令 w(x，y) 表 示 图 G 中 边 (x，y) 的 权重 ，G, 为 图 G 的 一 个 子 图 ，F 为 图 G, 的 最 小 生成 森林 ， 
w(xX，y) 为 在 F 中 连接 x 与 y 的 路 径 中 边 的 最 大 权重 。 如 果 在 F 中 x 与 y 不 相连 ， 那 么 令 wy(x, y= %。 
HOFF, awe, y)>we(x, yw, ywr, y), BARU, VEFE (FRA). 

参见 图 11-144， 可 知 边 (e， 及 、(a，d) 和 (c，g) 都 是 关于 F 的 F 重 的 。 在 定义 了 这 个 新 概念 
后 ， 有 如 下 引 理 ， 对 使 用 Boruvka 步 又 是 非常 重要 的 。 

引 理 2: 邻 G, 为 图 G(V，E) 的 子 图 ，F 为 图 G, 的 最 小 生成 森林 ， 图 G 中 相对 于 天 的 F 重 边 不 
可 能 是 图 G 的 最 小 生成 树 的 边 。 





c) d) 
图 11-14 FE 


我 们 不 证 明 该 引 理 。 运 用 该 引 理 ， 可 知 边 (e,， 户 、(a， 中 和 (c，8) 不 是 最 小 生成 树 的 边 。 

为 了 完全 运用 Boruvka 步 骤 ， 需 要 引入 另 一 个 引 理 ， 即 引 理 3。 

引 理 3; 令 H 为 从 G 得 到 的 子 图 ， 它 是 通过 以 概率 p 独 立地 包含 每 条 边 ，F 为 H 的 最 小 生成 
森林 。 在 G 中 ，F 轻 (F-light) 边 的 期 望 数 最 多 为 n/p， 其 中 n 为 G 中 顶点 的 个 数 。 
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随机 的 最 小 生成 树 算法 描述 如 下 。 


算法 11-5 随机 的 最 小 生成 树 算法 

RA. 带 权 的 连通 图 G。 

输出 : G 的 最 小 生成 树 。 

步骤 1. 连续 使 用 Boruvka 步 又 三 次 ， 令 最 终 的 图 为 Gi(V,，E1)。 如 果 图 G1 只 含 一 个 结 点 ， 那 么 返回 步骤 1 中 标记 
的 边 集合 并 退出 。 

步骤 2. 以 概率 1/2 独 立地 从 Gi 中 选 出 每 条 过 构造 半 图 思 。 递 归 地 对 H 运 用 该 算法 得 出 H 的 最 小 生成 森林 记 。 通 过 删 
除 G, 中 相对 十 F 的 所 有 F 重 边 后 得 到 图 Ga(VY,，E;)。 

PRS. 对 G, 递 由 地 应 用 该 算法 。 


接 下 来 分 析 算 法 11-5 的 时 间 复 杂 度 。 

令 T(VI，IED) 表 示 该 算法 对 图 G(V，E) 的 期 望 运行 时 间 。 

步骤 1 的 每 次 执行 花费 OUIVIL + EDE. PRITA, VISIVI RIEKIE, HFE 
又 2， 计 算 所 需要 的 时 间 为 OUVIE+ IE = OUV + ED, HAFB EMH ATCV I, 16/2) = 
TUVV8, ，1EV2)， 删 除 所 有 下 重 边 所 需 的 时 间 为 OUVil + 1B) = OUV + 1B2D)。 运 用 引 理 3 可 知 ，IEl 
的 期 望 值 最 多 为 21V,1<1yW/4。 因 此 ， 步 又 3 的 执行 时 间 为 T(Vol，1E2) = TUYV8，IVV4)。 令 IVI = 
n，1lEi=m， 有 如 下 的 递归 关系 式 : 

T(n, m)<T(n/8, m/2) + T(n/8, n/4) + c(n +m) 
对 某 个 常数 c 成 立 。 可 以 证 明 

Tin, m)y<2c - (n +m) 

我 们 鼓励 读者 将 (2) 代 入 (1) 来 检验 该 解 ， 因 此 ， 算 法 的 期 望 运行 时 间 为 OUa + m)。 
1.7 注释 与 参考 


随机 算法 的 概述 可 在 文献 Maffioli(1986) 中 找到 。 文 献 Gill(1987) 和 Kurtz(1987) 也 分 别 纵览 
了 随机 算法 。 值 得 提出 的 是 ， 对 于 不 同 的 人 随机 算法 意味 着 不 同 的 东西 。 它 有 时 表明 一 个 算 
法 在 平均 情况 下 是 好 的 。 也 就 是 说 ， 算 法 因 不 同 的 数据 集 而 不 同 。 在 本 书 中 ， 我 们 强调 随机 
算法 是 一 种 在 运行 过 程 中 采用 抛 柳 硬 币 的 随机 的 算法 。 换 言 之 ， 对 于 相同 的 数据 输入 ， 因 为 
过 程 的 随机 性 ， 其 结果 可 能 非常 不 同 。 

通过 随机 算法 解决 最 近 点 对 问题 是 由 Rabin(1976) 提 出 的 。 最 新 的 成 果 可 参阅 文献 
Clarkson(1988)。 运 用 随机 算法 检测 素数 ， 参 阅 文 献 Solovay and Strassen(1977) 和 Rabin(1980)。 
素数 判定 问题 由 文献 Agrawal，Kayal and Saxena(2004) 证 明 是 多 项 式 问题 。 模 式 匹配 的 随机 算 
法 出 现在 文献 Karp and Rabin(1987) 中 。 交 互 式 验证 的 随机 算法 由 文献 Goldwasser，Micali and 
Rackoff(1988) 发 现 的 。 文 献 Galil，Haber and Yung(1989) 提 出 了 对 该 方法 的 进一步 改善 。 随 机 
的 最 小 生成 树 算法 在 文献 Karger，Klein and Tarjan(1995) 中 找 出 。Boravka 步 又 则 是 在 文献 
Boruvka (1926) 所 发 现 ， 而 删除 F 重 边 方法 可 在 文献 Dixon Rauch and Tarjan(1992) 中 找到 。 

随机 算法 在 文献 Brassard and Bratley(1988) 中 广泛 地 讨论 。 


11.8 进一步 的 阅读 资料 


随机 算法 可 分 为 两 类 :顺序 的 和 并 行 的 。 虽 然 本 书 中 只 讲解 了 随机 顺序 算法 ， 但 我 们 也 推 
荐 一 些 随机 并 行 算法 。 
对 于 随机 顺序 算法 ， 我 们 推荐 ， Agarwal and Sharir(1996), Anderson and Woll(1997); 
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Chazelle, Edelsbrunner, Guibas, Sharir and Snoeyink (1993) ; Cheriyan and Harerup( 1995); 
Clarkson(1987); Clarkson(1988); d’Amore and Liberatore(1994); Dyer and Frieze(1989); 
Goldwasser and Micali(1984); Kannan, Mount and Tayur(1995); Karger and Stein(1996); 
Karp(1986); Karp, Motwani and Raghavan(1988); Matousek(1991),; Matousek(1995), 
Megiddo and Zemel(1986), Mulmuley, Vazirani and Vazirani(!987); Raghavan and 
Thompson(1987); Teia(1993); Ting and Yao(1994); Wenger(1997); Wu and Tang(1992), 
Yao(199 DELA Zemel( 1987), 

对 于 随机 并 行 算法 ， 我 们 推荐 Alon，Babai and Itai(1986); Anderson(1987); Luby(1986) 
and Spirakis(1988), 

大 量 最 新 出 版 的 论文 包括 : Aiello, Rajagopalan and Venkatesan(1998); Albers(2002), 
Alberts and Henzinger(1995); Arora and Brinkman(2002); Bartal and Grove(2000); Chen and 
Hwang(2003); Deng and Mahajan(1991); Epstein; Noga, Seiden, Segall and 
Woeginger(1999), Froda(2000);, Har-Peled(2000); Kleffe and Borodovsky (1992) , Klein and 


Subramanian(1997), Leonardi, Spaccamela, Presciutti and Ros(2001); Meacham(1981) and 
Sgall(1996), 


习题 


11.1 编程 实现 解决 最 近 点 对 问题 的 随机 算法 ， 并 测试 你 的 算法 。 
11.2 利用 随机 的 素数 测试 算法 确定 下 列 数 是 否 素数 : 13, 15, 17, 
11.3 对 于 下 列 两 字符 串 使 用 随机 的 模式 匹配 算法 。 
X=0101 
Y=0010111 
11.4 利用 11.5 节 中 介绍 的 算法 判断 5 是 否 13 的 二 次 剩余 。 举 出 一 个 得 出 错误 结论 的 例子 。 
11.5 阅读 文献 Brassard and Bratley(1988) 中 的 8.5 节 和 8.6 节 。 





第 12 章 在 线 算 法 


在 前 面 所 介绍 的 各 章 ， 算 法 设计 基于 这 样 的 假设 ， 即 在 算法 执行 之 前 ， 整 个 数据 的 情况 都 
是 可 知 的 。 也 就 是 ， 问 题 是 与 完整 的 数据 信息 一 起 解决 的 。 然 而 ， 事 实 上 并 不 完全 是 这 样 的 。 
考虑 磁盘 调度 问题 (disk scheduling problem) ， 对 算法 来 说 ， 磁 盘 的 服务 请 求 是 完全 不 知 的 ， 
请 求 一 个 接 一 个 地 到 来 。 出 现在 操作 系统 设计 中 的 分 页 问题 (paging problem) 也 是 一 个 在 线 
问题 (on-line problem)。 在 执行 程序 之 前 无 法 确定 哪个 页 面 将 被 访问 。 如 果 每 个 数据 都 是 在 线 
到 来 ， 在 线 算法 就 必须 采取 行动 处 理 到 达 的 每 个 数据 。 由 于 没有 完整 的 信息 可 用 ， 在 此 时 看 似 
正确 的 处 理 ， 但 在 之 后 可 能 就 会 产生 错误 。 因 此 ， 从 这 个 意义 上 在 线 算 法 (on-line algorithm) 
都 是 近似 算法 (approximation algorithm) ， 不 能 保证 产生 最 优 解 。 以 在 线 最 小 生成 树 问 题 (on- 
line minimum spanning tree problem) 为 例 ， 在 这 种 情况 下 ， 首 先 必须 放弃 “最 小 ”这 个 词 ， 因 
为 生成 树 不 会 是 最 小 的 。 因 此 ， 把 这 个 问题 称 为 在 线 小 生成 树 问题 (on-line small spanning tree 
problem)。 在 线 算 法 处 理 该 问题 的 过 程 如 下 : 每 次 当 一 个 数据 项 到 达 时 ， 将 其 与 离 它 最 近 的 邻 
点 相连 接 。 假 设 有 如 图 12-1 所 示 的 6 个 点 ， 数 据 按 指定 的 顺序 到 达 ， 那 么 在 线 算法 产生 一 个 如 
图 12-2 所 示 的 生成 树 。 显 然 ， 这 棵 生成 树 不 是 最 优 的 。 依 据 全 部 数据 信息 的 最 优生 成 树 如 图 
12-3 所 示 。 
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图 12-! 说 明 在 线 生 成 树 算法 的 数据 集 图 12-2 在 线 小 生成 树 算法 产生 的 生成 树 


由 于 任何 在 线 算法 一 定 是 近似 算法 ， 所 以 
对 它 性 能 的 度量 自然 是 通过 将 它 与 最 优 离线 算 
法 (optimal off-line algorithm) 所 得 结果 做 对 
比 来 得 到 的 。 对 同一 个 数据 集 ， 令 Co (Cuz) 
表示 运行 在 线 (最 优 离线 ) 算法 的 代价 。 如 果 
Cun Sc: Coy + b， 其 中 b 是 一 个 常量 ， 那 么 称 
该 在 线 算法 的 性 能 比 (performance ratio) 是 c， 
算法 是 c 可 竞争 的 (c-competitive)。 如 果 c 不 能 
再 小 ， 就 说 这 个 在 线 算法 是 最 优 的 。 由 于 在 线 
算法 的 设计 必须 与 分 析 联 系 在 一 起 ， 所 以 在 线 
算法 的 设计 决 不 是 一 件 容 易 的 事情 。 在 本 章 中 ， 图 12-3 依据 图 12-1 中 数据 产生 的 最 小 生成 树 
将 介绍 几 种 在 线 算 法 及 对 它们 的 分 析 。 
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121 用 贪心 法 解决 在 线 欧 几 里 得 生成 树 问 题 


在 欧 儿 里 得 最 小 生成 树 问 题 中 ， 已 知 平面 上 的 一 个 点 集 ， 要 构造 出 这 些 点 的 一 棵 最 小 生 
成 树 。 对 于 该 问题 的 在 线 方案 ， 各 个 点 逐个 出 现 ， 无 论 在 任何 时 候 出 现 某 一 点 ， 都 必须 采取 
行动 将 这 个 点 与 已 经 构造 好 的 生成 树 相 连接 。 此 外 ， 所 采取 的 行为 是 不 可 逆 的 。 显 然 ， 由 在 
线 算法 所 构造 的 树 一 定 是 近似 树 。 解 决 这 种 欧 几 里 得 生成 树 问题 的 贪心 法 可 描述 如 下 : Sv, 
V2，…，Vi-! 是 将 出 现 的 点 ，T 是 目前 构造 的 生成 树 ， 将 vi 与 ww ，v，,，，… ，vi_! 间 的 最 短 边 深 加 到 
T 中 。 参 见 图 12-4 所 示 的 点 集 ， 通 过 贪心 法 构造 的 生成 树 如 图 12-5 所 示 。 


ve 


v @”, y v 
4 4 
图 12-4 五 个 点 的 集合 图 12-5 用 贪心 法 构造 的 生成 树 


接 下 来 分 析 基 于 贪心 法 的 在 线 算法 性 能 。 令 5 表示 n 个 点 的 集合 ，! 表 示 对 集合 5 所 构造 的 最 
小 生成 树 的 长 度 ，T, 表 示 由 在 线 算法 所 构造 的 生成 树 。 我 们 将 证 明 该 算法 是 O(log n) 可 竞争 的 。 
实质 上 ， 要 证 明 在 7, 中 ， 第 长 边 的 长 度 最 大 是 2Uk (1<k<n~1)。 另 一 种 说 法 是 在 T。 
中 最 多 有 k 一 1 条 边 ， 其 长 度 大 于 2Wk。 已 知 产生 Tn 的 顶点 序列 ， 令 Si 表示 加 入 Tt 中 使 边 的 长 
度 大 于 2 的 点 集 。 这 样 ， 原 来 的 陈述 变 成 : 8% 的 基数 小 于 。 为 证 明 此 结论 ， 注 意 根 据 该 贪 
心 在 线 算法 的 定义 ， 在 8% 中 每 对 顶点 间 的 距离 一 定 大 于 2Wk。 因 此 ， 在 S$; 上 最 优 旅行 商 问 题 回 
路 的 长 度 必须 大 于 
is, 17! 
k 
因为 由 相同 点 集 所 构造 的 最 优 旅 行商 问题 的 回路 长 度 最 多 是 同一 点 集 最 小 生成 树 长 度 的 
两 倍 ， 所 以 ， 在 % 上 的 最 小 生成 树 的 长 度 大 于 


Is, 1È 
k 
由 于 S 上 的 最 小 生成 树 的 长 度 小 于 由 5 上 的 最 小 生成 树 的 长 度 ， 可 得 
Is, 1 <1 
k 
或 者 等 价 地 ， 
IS, < 大 


这 意味 着 8 的 基数 小 于 上 ， 从 而 证 明 原来 的 陈述 ， 在 To 中 ， 第 长 边 的 长 度 最 大 是 21/K。 


这 样 ， Ti 的 总 长 度 最 大 为 
n—l 21 n-l l 
Da toe) 


这 说 明 贪心 在 线 生 成 树 算法 是 O(log nn) 可 竞争 的 。 这 个 算法 是 最 优 的 吗 ? 当然 不 是 。 可 以 
证 明 竞争 比 的 下 界 是 (log mwlog log n)。 这 将 在 下 面 讨 论 。 对 于 在 线 生成 树 问题 将 找 出 一 个 输 
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入 a， 并 证 明 不 存在 在 线 算 法 4， 使 得 由 算法 4 和 输入 o 构 造 的 生成 树 长 度 与 以 同样 输入 a 构 造 
的 最 小 生成 树 长 度 之 比 是 Q(log mlog log n)。 接 下 来 ， 要 描述 该 输入 o。 输 入 o 的 所 有 点 都 在 
一 个 网 格 内 ， Birtek Ax S2, Sx = n， 那 么 x 之 1/2(log n/log log n) 且 n 之 16。 该 输入 由 
x +1 层 的 点 所 组 成 ， 其 中 每 一 层 又 是 由 长 度 为 x = x* 的 水 平 线 均匀 隔 开 的 点 集 。 在 第 ; 层 (0< 
i<x) 点 的 坐标 记 为 (a; > b;), Hha, = ai 当 = OW}, b; = 0; 当 i 关 0 有 时， HO<j<n/a, 


b= Da 。 从 而 ,mw = 说 ( =n)，a, = 1。 对 于 所 有 的 i， 第 i 层 和 第 i +1 层 之 间 顶 点 间 的 距离 是 


c = b;, 一 b;= a;,。 在 第 i 层 上 的 顶点 数 为 二 +1。 输 入 顶点 的 总 数 为 : 
a 
x n r x 
Sla- Se=) 
= yo +1) 











xto] 
= 一 一 +x+1 
x-i 
nx? -1 
= -一 +x+1 
X -l 
n-i 
=n+—;—— +x+l1 
X -l 
= O(n) 


对 于 x = 2 和 n = 16 的 一 个 输入 例子 a 如 图 12-6 所 示 。 


a. 
20. © ee ee ee ee ee e 8 oo 








0 e« a 

x=2 a,= 16 co=4 

n= 16 a,=4 c= 
a,=1 


图 12-6 一 个 输入 a 例 子 


该 输入 的 最 小 生成 树 的 构造 如 下 : 
(1) 第 x 层 的 每 个 点 与 它 的 邻 点 水 平 相连 接 。 
(2) 其 他 每 个 点 与 邻 点 垂直 相连 接 。( 图 12-7 所 示 是 图 12-6 的 顶点 形成 的 最 小 生成 树 。) 


2 
1 


x=2 a,=16 co=4 
n=16 a,=4 c=! 
a,=1 


图 12-7 在 图 12-6 中 的 顶点 形成 的 最 小 生成 树 
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该 最 小 生成 树 的 总 长 度 为 


<3n 
假设 o 中 的 点 是 在 线 地 从 第 0 层 到 第 x 层 逐 层 地 给 出 。 令 7， 表示 在 对 获得 第 i 层 点 之 前 ， 在 
线 算法 的 图 。 在 第 ; 层 上 已 安排 有 [可 > 卫 个 点 。 注 意 ， 在 第 ; 层 两 个 相 邻 点 之 间 的 距离 是 0 。 


对 于 每 个 点 ， 任 意 边 7 一 T | 的 长 度 至 少 是 a; ， 即 对 于 第 i 野 ， 由 在 线 算法 增加 的 生成 树 的 总 长 
度 至 少 是 
n 
—a,=n 
所 以 ， 由 在 线 算法 构造 的 生成 树 的 总 长 度 至 少 是 n . x, 
由 Cy 3n 及 Cs 之 nx， 可 得 
C, i 


onl ~> 
—— = 


Coy 


这 意味 着 该 问题 的 竞争 比 下 界 是 Q(log mlog log n)， 由 于 我 们 介绍 的 算法 是 O(log ni% 
和 争 的 ， 所 以 它 不 是 最 优 的 。 


12.2 在 线 k 服务 员 问 题 及 解决 定义 在 平面 树 上 该 问题 的 贪心 算法 


现在 考虑 kK 服务员 问题 (k-sever problem), gs, 
已 知 有 n 个 顶点 的 图 ， 每 条 边 分 配 一 个 正 的 边 
长 。 令 在 k (k<n) 个 顶点 处 分 配 k 名 服务 员 。 
已 知 对 服务 员 的 请 求 序列 ， 必 须 判 定 如 何 调 动 
服务 员 才 能 满足 请 求 。 对 一 个 请 求 的 服务 代价 
是 满足 该 请 求 在 服务 员 移 动 的 总 距离 。 参 见 如 
图 12-8， 有 三 名 服务 员 s,、s; 和 s;， 分 别 位 于 a、 
e 和 8 ， 假 如 在 顶点 i 有 一 个 请 求 ， 由 于 e 靠 近 i, h 
那么 可 能 的 一 种 移动 方法 是 把 位 于 顶点 e 处 的 *。 
移 到 顶点 处。 

基于 贪心 策略 的 解决 该 :服务 员 问 题 的 在 线 算法 是 移动 离 请 求 所 在 位 置 最 近 的 服务 员 。 不 
过 这 种 头脑 简单 的 贪心 在 线 算法 有 一 个 瑕 完 ， 如 图 12-9 所 示 。 


logn 





-NX = le 
3 6loglogn 


L|- 







SS request 
x 


图 12-8 k 上 服务 员 问 题 实例 
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假设 有 一 名 服务 员 位 于 顶点 4， 第 一 个 请 求 r, 来 自 顶 点 <， 贪心 算法 会 把 位 于 顶点 d 的 服务 


员 移 到 c， 此 时 第 二 个 请 求 到 达 ， 而 遗憾 的 是 
它 来 自 d， 那 么 ， 再 把 服务 员 从 c 移 到 d。 如 图 
12-9 所 示 ， 如 果 请 求 不 断 在 c 和 d 之 间 转 换 ， 那 
么 服务 员 就 不 停 地 在 c 和 d 之 间 和 移动。 实际 上 ， 
正如 下 面 所 示 ， 如 果 把 位 于 /的 服务 员 逐 渐 地 
移 到 d， 服 务 员 最 终 位 于 d 一 段 时 间 ， 那 么 不 停 
地 在 c 和 d 之 间 移 动 服 务 员 的 现象 就 会 避免 。 解 
决 该 问题 改进 的 贪心 算法 移动 许多 所 谓 的 活动 
服务 员 (active severs) 到 当前 请 求 所 在 顶点 
位 置 。 我 们 将 服务 员 问 题 限制 在 一 棵 平面 树 T 
中 。 由 于 7 是 一 棵 平面 树 ， 所 以 T 中 各 边 的 长 度 
满足 三 角 不 等 式 。 令 x 和 y 是 T 中 的 两 个 点 ， 它 
们 之 间 的 距离 指 T 中 从 x 到 y 的 简单 路 径 长 度 ， 
WA, ye Ss 和 d; 分 别 表示 服务 员 i 及 他 目前 


所 处 的 位 置 。 区 间 (x, yy] 表示 7 中 从 x 到 y 的 路 径 ， . 


不 包括 +。 如 果 在 区 间 (d; ，x] 中 再 没有 其 他 服 
务 员 ， 那 么 相对 于 x 处 的 请 求 ， 称 服务 员 s; 是 活 
动 的。 改进 的 贪心 在 线 k 服 务 员 算法 执行 如 下 : 
当 x 点 有 请 求 时 ， 将 当前 相对 于 x 的 所 有 活动 服 
务 员 以 相同 速度 不 断 移 向 x， 直 到 某 一 名 服务 
员 到 达 x*。 如 果 在 移动 期 间 ， 某 一 名 活动 服务 
员 变 为 不 活动 的 话 ， 就 中 止 。 图 12-10 所 示 是 
相对 于 一 个 请 求 ， 上 述 改进 的 贪心 法 。 

现在 ， 对 该 算法 进行 性 能 分 析 。 首 先 定义 
全 信息 的 k 服 务 员 在 线 算法 。 该 算法 是 绝对 在 
线 的 。 也 就 是 在 每 次 请 求 之 后 ， 算 法 将 移动 一 
名 服务 员 到 最 近 的 请 求 发 起 顶点 。 然 而 ， 由 于 
算法 是 全 信息 的 ， 它 拥有 完全 的 请 求 序列 的 信 
息 。 所 以 ， 它 的 行为 将 与 普通 的 不 具有 全 信息 
的 在 线 算法 大 不 相同 。 事实 上 ， 它 是 最 优 算法 ， 
因为 它 能 产生 最 优 结果 。 

参见 图 12-11， 在 a 和 d 两 点 分 别 有 两 名 服务 
员 s, 和 s,， 假 定 请 求 序列 为 : 

(1) 请 求 m 在 5 点 。 

(2) 请 求 r, 在 e 点 。 

对 于 不 包含 全 “信息 ”的 贪心 在 线 算法 ， 
服务 员 的 移动 如 下 : 

(1) 把 5 从 ad 移动 到 b， 代 价 为 5。 

(2) 把 9 从 2 移动 到 e， 代 价 为 7。 

总 代价 为 12。 





图 12-9 一 种 贪心 在 线 k 服 务 员 算法 的 最 坏 情 况 


VM 


request 


\ 


Ny 


| 
| 
e 


图 12-10 改进 的 贪心 在 线 k 服 务 员 算法 





图 12-11 完全 信息 的 /服务 员 在 线 算 法 的 实例 


对 于 全 信息 的 k 服 务 员 在 线 算法 ， 服 务 员 的 移动 如 下 : 
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(1) 把 ,从 a 移动 到 bp， 代 价 为 6。 
(2) 把 ,从 ad 移动 到 e， 代 价 为 2。 


总 代价 仅 为 8。 由 于 全 信息 在 线 算法 知道 请 求 王位 于 e， 所 以 在 开始 它 移动 "而 不 是 ">。 

我 们 的 分 析 是 对 比 改 进 的 贪心 在 线 k 服 务 员 算 法 与 全 信息 在 线 k 服 务 员 算 法 的 移动 代价 。 
急 象 一 个 游戏 ， 在 每 次 请 求 到 达 时 ， 知 道 全 信息 的 对 手 做 一 次 和 移动。 然后， 我 们 也 做 一 次 移 
动 。 需 要 注意 在 我 们 移动 所 有 相对 于 该 请 求 的 所 有 活动 服务 员 时 ， 我 们 的 对 手 只 移动 一 名 服 
务 员 。 正 如 在 分 摊 分 析 中 所 做 的 ， 定 义 一 个 势能 函数 ， 将 我 们 及 对 手 所 有 位 置 上 的 x 名 服务 员 


映射 为 - -个 非 负 实数 。 


SP RMF (全 信息 算法 ) 在 响应 第 i 个 请 求 后 及 我 们 (贪心 法 ) 在 响应 第 i 个 请 求 之 


前 势能 函数 的 值 ，vy; 表示 贪心 法 在 响应 第 i 个 请 求 
后 且 响 应 第 (i +1) 个 请 求 之 前 的 势能 函数 的 值 ，Yo 
表示 势能 函数 的 初 值 。 这 些 术语 最 好 在 图 12-12 中 
加 以 说 明 。 

令 我 们 的 贪心 法 与 对 手 的 全 信息 算法 响应 第 ; 
个 请 求 的 代价 分 别 用 O; 和 4, 表示 ，O 和 4 分 别 表示 
所 有 的 请 求 后 贪心 法 与 全 信息 法 的 总 代价 ， 证 明 下 
列 的 不 等 式 。 

(1) 对 于 某 一 a， 万 ， ~w,,<aA,, 1<i<n, 

(2) 对 于 某 一 5， yp; — wy, = BO; , l<ic<n, 

上 述 等 式 可 扩展 为 ， 

Ü, — PoSaA, 

yi ý, < — pO" 

YP, -Y S aA, 

一 PS — BO, 
y, — yp, S aÀ, 


Wa yp, < — BO, 
将 各 式 相 加 ， 可 以 得 到 


W,— YS aA, + A, + + A,) ~ PCO, + O, + ++ O) 


BO< aA + Wo— Wn 
Hy, 20, 
POSA + YW 


a 1 
O< pi p” 


。 ` BINAR: 
对 手 移动 ; 
— hi 


我 们 移动 ， 
< hi 
。 第 (i+1) PAR: 


图 12-12 响应 请 求 的 势能 函数 值 


现在 定义 势能 函数 。 在 任意 时 间 的 实例 中 ， 令 贪心 在 线 k 服 务 员 算 法 的 k 名 服务 员 位 于 b,， 


b,，…，b: ， 全 信息 算法 的 k 名 服务 员 位 于 a,，a;， 


vw 定义 一 个 二 分 图 ， 其 中 v; (v1') 分 别 表 示 b (a), 边 (v ， 
可 以 进行 最 小 带 权 匹配 (minimum weighted matching) , 


1 . 
ak o Hv», Voy “T's v 及 vi ， Vaa "5 


v') 的 权 值 为 lb; ，ajl。 在 该 二 分 图 中 ， 


= 对 Ms|+ Sls 
名 
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HU, -y 1。 由 于 只 有 在 全 信息 算法 做 一 次 移动 ， 才 有 一 个 a 改变 。 因 此， 在 y 中 ， 
仅 有 可 能 的 增加 与 Ml 的 改变 有 关 ， 它 等 干 4, ， 故 得 到 

y; — Yi 1 SKA; (12-1) 

MEXE- I. HERR, ROR KIS ABA, <k, PAIRS A 

移动 的 距离 都 为 4。 对 Mi 来 说 ， 至 少 有 一 条 匹配 的 边 将 减少 到 0， 因 为 两 个 算法 都 必须 满足 

第 个 请 求 ， 故 必 有 - -对 w 和 v, 间 的 距离 为 0%， 这 意味 着 Mw 至 少 增加 -d+ q- Dd =(g 一 2)d。 

现在 计算 ,|b.,b i 的 增加 。 令 4 表示 贪心 算法 一 名 活动 服务 员 的 位 置 ，b, 表示 使 得 ,位 

于 第 ;个 请 求 与 之 间 一 名 服务 员 的 位 置 ，/, 表示 b, 的 数目 。 由 于 位 于 d, 的 服务 员 每 次 移动 4 趾 

离 ， 故 在 d 与 4, 个 b, 之 间 移动 距离 的 和 将 增加 (1, 一 1)4， 但 对 于 另外 的 (k 一 1 ) 名 服务 员 ， 移 动 

距离 的 和 将 会 减少 (K 一 1,)4。 因 此 ， 对 于 第 个 请 求 ， 随 着 g 名 服务 员 的 移动 ， 增 加 的 总 距离 至 
多 为 》(, 一 1+1, Dd。 所 以 ， 势 能 函数 的 改变 至 多 是 


q 4 
k(q—2)d+ X (l,-l+1,—-kd = -qd (ia l =x) 
q > p P q 他 


即 ， 得 到 

w—Y; <—qd 
或 者 等 价 地 ， 

Yi —Y 20; (12-2) 
合并 式 (12-1) 和 式 (12-2)， 可 以 得 到 

O<kA + Wo 


这 正 是 想 要 得 到 的 。 因 此 ，/ 服 务 员 问题 的 在 线 算 法 是 k 可 竞争 的 。 

已 证 明 在 线 k 服 务 员 算 法 是 x 可 竞争 的 ， 那 么 我 们 自然 要 问 : 在 线 算 法 是 最 优 算法 吗 ? 是 
否 存 在 其 他 在 线 k 服 务 员 算 法 有 更 好 的 性 能 昵 ?” 例 如 ， 能 否 有 Kk/2 可 竞争 的 在 线 k 服 务 员 算 法 ? 
我 们 将 证 明 这 是 不 可 能 的 。 换 句 话说 ， 在 此 介绍 的 在 线 k 服 务 员 算法 确实 是 最 优 的 。 

首先 注意 到 在 线 算法 是 定义 在 平面 树 上 ， 边 长 满足 三 角 不 等 式 。 此 外 ， 算 法 同时 移动 几 
名 服务 员 ， 而 不 是 一 名 。 为 了 证 明 在 线 k 服 务 员 算法 的 最 优 性 ， 定 义 一 个 称 为 “懒惰 的 在 线 k 
服务 员 算 法 ” (lazy on-line k-server algorithm) 的 算法 。 如 果 处 理 每 个 请 求 仅 移动 一 名 服务 员 ， 
那么 该 在 线 k 服 务 员 算法 称 为 是 懒惰 的 。 

容易 看 到 ， 如 果 一 个 非 懒 情 在 线 k 服 务 员 算法 的 执行 基于 一 个 满足 三 角 不 等 式 的 图 ， 那 么 
在 不 增加 执行 代价 的 条 件 下 ， 该 在 线 算法 可 以 转化 为 懒惰 的 在 线 k 服 务 员 算法 。 令 D 表 示 非 懒 
惰 的 在 线 : 服 务 员 算法 。 为 了 满足 某 一 请 求 ，D 需 把 服务 员 s 从 v 移 动 到 w。 但 是 ， 由 于 D 是 非 懒 
惰 的 ， 在 本 步 难 之 前 ， 即 使 在 v 处 没有 请 求 ，D 也 必须 把 5 从 wu 移动 到 v， 那么 把 s 从 4 移动 到 w 的 
代价 为 4d(n，v) + d(v，w)， 由 三 角 不 等 式 可 知 ， 该 代价 大 于 等 于 d(w，w)。 因 此 ， 可 以 去 掉 移 
动 s 从 u 到 v 这 一 步 而 不 增加 代价 。 

在 下 面 的 讨论 中 ， 假 设 在 线 k 服 务 员 算法 是 一 个 懒惰 算法 。 

令 D 表 示 任 何在 线 的 k 服 务 员 算法 ，G(Y，E) 表 示 在 G 的 个 不 同 的 顶点 有 Kk 个 不 同 的 服务 员 
的 图 。v 是 V 的 一 个 子 集 ， 包 括 k 名 服务 员 初 始 时 所 在 的 k 个 顶点 及 G 的 另 一 个 任意 顶点 +。 定 义 
请 求 序列 为 ; 

(1) o(1) 位 于 x 处 。 
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(2) X Fizl, COOREMAE A RDP A Ev PERITU o 

参见 图 12-13 。 

令 k = 3， 王 名 服务 员 的 初始 位 置 分 别 在 a，c 和 f/f。 令 另 一 
个 选 树 的 点 是 4， 那 么 vi = {a，c，f，d}。 现 在 ， 第 一 个 请 求 
0 (1) 一 定 在 4 处。 如 果 D 把 s; 从 c 移 动 到 4d， 将 c 空 出 ， 那 么 
0(2) = c。 如 果 D 接 着 把 s, 从 a 移动 到 c， 将 a 空 出 ,那么 o(3) = a。 
对 于 这 个 请 求 序列 ，D 在 o(1)，o(2)，…，o() 的 服务 代价 为 


Co, N= $ doli +1), o(i)) 


现在 定义 一 个 比 算法 D 有 更 多 信息 的 在 线 k 服 务 员 算法 ， 
称 为 算法 E。 因 为 算法 E 设 法 知道 了 o(1)， 所 以 算法 E 具 有 更 
多 的 信息 。 今 久 是 0(1)， 且 是 vi 一 o0(1) 的 具有 Kk 一 1 个 顶点 的 任 
一 子 集 。 例 如 ， 在 上 例 中 ,vi = {a,，c，f，d}。 由 于 o(1) = dv 可 以 是 {a, c, d}, {c, f, d} 
或 {a，f，d}， 考 虑 到 该 顶点 子 集 v,， 可 定义 一 个 在 线 k 服 务 员 算 法 E(v,)， 它 比 算法 DP 有 更 多 的 
信息 如 下 : 

如 果 v 包 含 o0(1)， 那 么 什么 也 不 做 ， 否 则 ， 把 在 o (i 一 1) 处 的 服务 员 移 动 到 o (i)， 更 新 y, 以 
反映 该 变化 。 初 始 时 ， 服 务 员 都 占据 v, 中 的 点 。 

注意 在 这 个 例子 中 ， 初 始 条 件 改 变 了 ， 因 为 初始 时 服务 员 位 于 o (1) 所 在 位 置 。 在 这 种 情 
况 下 ，E(v;) 在 满足 第 一 个 请 求 时 不 必 移动 任何 服务 员 ， 这 就 是 为 什么 说 E(v) 比 D 具 有 更 多 信 
息 。E(v;) 花 费 的 代价 绝 不 比 D 更 多 ， 所 以 可 作为 所 有 在 线 k 服 务 员 算法 的 下 界 。 因 此 易 知 ， 对 
所 有 的 i>1， 当 第 i 步 开 始 时 ，v; 总 包含 着 0 (i 一 1)。 

再 次 通过 举例 说 明 此 概念 。 考 虑 如 图 12-13 所 示 的 情况 。 假 如 mw = {a，c，d} 及 

o(l)=d 

o(2)=e 

o(3)=f 

o(4) =a 

三 名 服务 员 * 、" 和 8 初始 分 别 占 据 ac、c 和 d， 那 么 E(vz) 运 行 如 下 : 

(1) 由 于 v, 中 包含 0(1) = 4， 那 么 什么 也 不 做 。 

(2) 由 于 vs 中 不 包含 0(2) = e， 那 么 把 位 于 o(1) = 4d 的 服务 员 s; 移 动 到 e， 并 令 v, = {a, c, 





图 12-13 3 服务 员 问 题 的 例子 


(3) 由 于 v, 中 不 包含 o(3) = f， 那 么 把 位 于 o (2) = e 的 服务 员 s; 移 动 到 /， 并 令 v, = {a, c, 


(4) 由 于 在 中 包含 0(3) = a， 那 么 什么 也 不 做 。 
由 于 中 包含 k +1 个 顶点 ， 所 以 共有 ( ， 中 ~ 个 不 同 的 w。， 即 有 4 个 不 同 的 Ev 算法。 人 


们 自然 要 问 : 哪个 E(v;) 性 能 最 好 ? 不 是 找 出 最 好 的 E(v») 算 法 的 代价 ， 而 是 找 出 这 k 个 E(v) 算 法 
的 期 望 代价 。 最 好 的 E(v,) 算 法 的 代价 将 会 比 期 望 的 代价 小 。 

根据 E(v;) 算 法 的 定义 ， 第 1 步 的 代价 为 0， 在 第 i +1(i 之 了 ) 步 ， 这 些 算法 或 者 什么 也 不 做 而 
BAR, REM (Fo (i 一 了 D 移 动 一 名 服务 员 ， 代 价 是 d(o (让 ，o(i +1))。 在 这 k 个 算法 中 ， 


enpe (i) 个 ， 其 包含 o()， 但 不 包含 ofi +1)， 将 承担 此 代价 ， 所 有 其 他 算法 的 代价 
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都 为 0。 所 以 对 于 第 i +1 步 ， 由 所 有 这 些 算法 所 增加 的 代价 是 d(o (i)，o (i +1))， 那 么 包含 o (7?) 
的 这 Kk 个 算法 的 总 代价 等 于 


Z dool -1)) 
因此 ，E(v,) 的 期 望 代价 为 
1 了 了 
Ew -上 re 
v 7 Dd dool 1)) 

= ~(d(o(2),0(0)) +d(03).02)) +-~ + d(o(t),o(t - 1))) 
1 

= (Suou +D,o()-d(olt +1), a(o) 


1 
= 7 Colo, t)-d(o(t +1),0(8))) 


ALA C,,(0,t) = Saot +1),0(i)) o 


最 好 的 E(v;) 算 法 代价 一 定 小 于 期 望 的 代价 。 令 它 为 E(v;))， 其 代价 表示 为 Capo XE, 
Cg 2 Cro) 


teplot) - tadou +1),0(1)) > Cy (0) 


即 C,(0,1) > k Cy... (0) 
或 者 等 价 地 ， 
C,(d,t) 
Cy, (OD) 
上 式 说 明 对 于 任意 非 全 信息 的 在 线 k 服 务 员 算法 ， 必 存在 一 个 有 更 多 信息 的 在 线 k 服 务 员 


算法 ， 其 代价 比 非 完全 算法 小 倍 。 这 证 明了 定义 在 平面 树 上 的 在 线 贪心 服务员 算 法 不 是 太 
好 的 。 


2k 


12.3 基于 平衡 策略 的 在 线 穿 越 障碍 算法 


本 节 讨 论 穿越 障碍 问题 (obstacle traversal 
problem) 。 设 有 一 个 方形 障碍 集 ， 集 合 中 所 有 
方块 的 边 平行 于 坐标 轴 ， 且 每 条 边 的 长 度 小 于 
或 等 于 1。 有 一 个 开始 点 ， 表 示 为 8 和 一 个 上 且 标 
点 ， 表 示 为 +。 穿 越 障碍 问题 是 要 避 开 障碍 找 
到 一 条 从 出 发 到 达 ! 的 最 短路 径 。 图 12-14 说 明 
一 个 典型 的 例子 。 

对 于 该 问题 ， 这 里 所 介绍 的 算法 是 在 线 算 
法 。 也 就 是 ， 没 有 整个 障碍 的 全 景 信息 。 这 样 ， 图 12-14 穿越 障碍 问题 的 一 个 例子 
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获得 最 优 解 是 不 可 能 的 。 搜 寻 者 从 s 开 始 利用 许多 启发 式 方法 来 指导 ， 这 些 启发 式 方法 形成 了 
在 线 算法 。 在 本 节 的 剩余 部 分 中 ， 将 描述 这 些 规则 。 

首先 注意 到 连接 s 与 ! 的 直线 是 :与 1 之 间 可 能 的 最 短 几何 距离 ， 因 此 ， 将 该 距离 表示 为 d， 
作为 所 得 解 的 下 界 。 后 面 将 所 得 的 解 与 4 做 比较 。 将 证 明 当 d 很 大 时 ， 使 用 在 线 算法 搜寻 者 所 
进 历 的 路 离 不 超过 34d/2。 

假设 从 到: 的 直线 与 水 平 轴 夹 角 < =, ， 否 则 它 与 坚 轴 夹 角 %s Z. 显然， 我 们 介绍 的 算 
法 稍 加 改动 后 仍 将 应 用 。 

令 o 表 未 从 s 到 /的 方向 。 接 下 来 ， 将 介绍 针对 
不 同情 况 的 所 有 规则 。 首 先 ， 了 解 有 多 少 种 情况 
必须 处 理 ， 参 见 图 12-15 所 示 。 6 c / 

择 少 有 三 种 情况 ; 

情况 1: 搜寻 者 从 障碍 物 中 间 穿 过 。 

情况 2， 搜寻 者 沿 障碍 物 水 平 边 ， 比 如 沿 4D。 

情况 3， 搜 寻 者 沿 障碍 物 坚 直 边 ， 比 如 沿 4B。 ^ p 

对 情况 1， 得 到 规则 1。 图 12-15 一 个 障碍 ABCD 

规则 1， 当 搜寻 者 在 障碍 物 中 间 穿 过 时 ， 它 沿 着 方向 a 前 进 ， 也 就 是 可 以 看 成 没有 障碍 物 
地 前 进 。 

一 旦 有 了 规则 1， 假 设 有 两 个 搜寻 者 ， 分 别 表示 为 P 和 0Q。P 是 真正 的 搜寻 者 ， 他 在 碰 到 障 
碍 物 时 要 设法 绕 开 它 ，Q 是 假想 的 搜寻 者 ， 他 沿 着 从 s 到 /的 直线 前 进而 忽略 障碍 物 。 我 们 将 对 
P 和 OQ 前进 的 距离 进行 比较 。 

规则 2: 如 果 搜 寻 者 与 障碍 物 的 水 平 边 4D 相 交 于 点 E， 他 会 沿 着 ED 前 进 ， 然 后 向 上 到 点 ， 
使 得 EF 与 ;~! 直 线 平行 ， 如 图 12-16 所 示 ， 随 后 它 重 新 沿 着 a 方向 前 进 。 

搜寻 者 P 前 进 的 距离 是 IEDI + IDFI， 对 于 同样 的 时 间 间 隔 ， 假 想 的 搜寻 者 Q 前 进 的 距离 是 
IEFI， 如 图 12-16 所 示 。(EDI +IDFDIERFI = cosy + siny 和 3/2。 从 而 可 知 ， 真 正 搜寻 者 遇 到 障 
碍 的 水 平 边 ， 沿 方形 的 水 平 边 前 进 的 距离 不 大 于 假想 搜寻 者 8 的 3/2 倍 。 

如 果 搜寻 者 P 遇 到 竖 直 边 ， 那 么 情况 较为 复杂 ， 可 通过 C 点 沿 w 方 向 作 一 直线 ， 交 4B 于 G， 
如 图 12-17 所 示 。 


从 s 到 ! 的 直线 


B 











图 12-16 与 4D 相 交 于 E 图 12-17 与 4B 相 交 于 H 


这 样 得 到 规则 3。 
规则 3， 如 果 搜 寻 者 P 与 障碍 物 的 竖 直 边 4B 相 交 于 BG 段 的 昌 ， 那么 他 向 上 到 B， 再 向 右 移 
动 到 1， 使 得 HI 与 直线 s-! 平 行 ， 如 图 12-17 所 示 。 然 后 重新 沿 方 向 a 前 进 。 
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易 证 明 在 此 例 中 ， 真 正 搜寻 者 P 前 进 的 距离 与 假想 搜寻 者 8 的 比率 不 大 于 3/2。 

如 果 搜 寻 者 P 与 障碍 物 的 竖 直 边 4G 段 相交 ， 那 么 规则 也 更 为 复杂 。 实 际 上 ， 这 些 规则 形 
成 了 平衡 策略 (balancing strategy) 的 核心 。 

FANS, 如 果 搜 寻 者 P 与 障碍 物 的 竖 直 边 48 的 4G 段 相交 ， 那 么 P 既 可 以 向 上 也 可 以 向 下 。 
如 果 他 向 上 移动 ， 那 么 移动 到 8 向 右 转 直到 角 C， 如 图 12-18a 所 示 。 如 果 它 向 下 移动 ， 那 么 移 
动 到 A 向 右 转 直到 角 D， 如 图 12-18b 所 示 。 在 遇 到 角 后 ， 重 新 沿 方 问 a 前 进 。 








图 12-18 交 于 边 48 的 两 种 情况 


规则 4 说 明 ， 如 果 搜 寻 者 交 于 4G 段 ， 那 么 它 既 可 以 向 上 也 可 以 向 下 移动 ， 现 在 的 问题 是 : 
如 何 决定 是 向 上 还 是 向 下 移动 呢 ? 

如 果 P 向 上 移动 ， 那 么 他 经 过 的 距离 为 rm = BHBC; sR PBs, BARE AT, = 
MA4I+I4DI。 而 在 这 段 时 间 里 ， 与 此 对 应 的 假想 搜寻 者 & 向 上 或 向 下 移动 的 距离 分 别 记 为 或 r>。 
距离 ri 和 mr 可 将 点 J/，C 和 D 投 影 到 > 一 直线 上 ， 如 图 12-19 所 示 。 在 图 12-19a 中 ，J 位 于 直线 一 ! 
之 下 ,在 图 12-19b 中 ，J 位 于 直线 s-! 之 上 。 





图 12-19 hoe File AY BA 


ALT, / 1 和 Tz 都 不 大 于 3/2， 那 么 这 将 是 好 的 。 但 并 不 
总 是 这 样 的 。 参 见 图 12-20 中 的 情况 ， 假 设 搜寻 者 向 上 移动 ， 
显而易见 ，z/m 几乎 为 2， 同 理 ， 参 见 图 12-21 中 的 情况 ， 假 
如 搜寻 者 向 下 移动 ，z/m: 也 几乎 为 2。 

在 1978 年 已 证 明了 zy 和 zz/z2 中 至 少 有 一 个 不 大 于 3/2。 
注意 到 交点 /或 者 位 于 s 一 :之 上 或 者 在 其 之 下 。 显 然 ， 如 果 J 位 
于 *-! 之 上 且 r/mi 和 3/2， 那 么 向 上 移动 ， 否则， 位 于 * 一 ! 之 下 4 D 
且 m/r 和 2/3， 那 么 向 下 移动 。 但 这 会 导致 P 不 停 地 向 上 或 向 ” 图 12-20 mm 有 最 坏 值 的 情况 
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下 移动 的 问题 ， 由 于 将 会 离 ? 一 ! 越 来 越 远 ， 这 未 必 是 有 益 的 。 

令 方形 的 边 长 为 k， 其 中 k< 1。 可 将 段 4G 划 分 为 长 度 都 为 REFR, hds- 
距离 。 如 果菜 段 的 最 低 点 满足 tz 所 3/2， 那 么 它 标记 为 向 上 ， 如 果 它 的 最 低 点 满足 /zw 3/2， 
那么 它 标记 为 向 下 。 一 段 既 可 标记 为 向 上 也 可 标记 为 向 下 。 B C 
如 果 只 标记 为 向 上 或 向 下 ， 那 么 该 段 称 为 “纯净 ” (pure) 
段 ， 否 则 称 为 “混合 ”(mixed) 段 。 

SJ 表示 第 i 段 的 最 低 点 ，Ji 表示 沿 方向 a 的 直线 过 点 J 
与 CD 边 的 交点 。 若 第 i 段 为 纯净 段 ， 如 果 它 标记 为 上 ， 那 么 
Pp; = IDINMCIA, MR RIAA, BAe, = ICT / IDI. A 
法 将 为 每 -… 段 保持 一 个 参数 ， 称 为 平衡 (balance)。 所 有 的 
平衡 初 值 为 0， 后 面 将 说 明 ， 平 衡 用 来 控制 是 向 上 还 是 向 下 
移动 。 

规则 5: 假设 搜寻 者 P 交 于 属于 第 i; 段 内 部 的 点 J。 

情形 1: 点 /位 于 直线 s--! 之 上 。 查 看 第 i 段 的 标记 ， 如 果 标 记 为 向 下 ， 那 么 向 下 移动 ， 否 则 ， 
查看 平衡 参数 balance。 如 果 balance 之 p;k， 那 么 向 下 移动 并 从 balance 中 减 去 pi;k，; 否则 ， 
balance 加 上 Kk 并 向 上 移动 。 

情形 2: 点 J 位 于 直线 st 之 下 。 查 看 第 i 段 的 标记 ， 如 果 标 记 为 向 上 ， 那么 向 上 移动 ， 否 则 ， 
查看 balance。 如 果 balance 之 p;k， 那 么 向 上 移动 并 从 balance 中 减 去 p;X， 否 则 ，balance 加 上 
并 向 下 移动 。 

最 后 ， 得 到 下 面 的 规则 。 

规则 6: 如 果 搜 寻 者 P 碰 到 与 目标 的 横 和 纵 坐 标 相等 ， 那 么 它 可 直达 目标 。 

以 上 介绍 的 是 在 线 穿越 障碍 算法 。 现 在 对 它 的 性 能 进行 分 析 。 首 先 ， 需 要 提醒 的 是 搜寻 
者 P 与 4D 边 相交 或 与 4B 边 的 段 BG 相 交 ， 那 么 P 与 8 前 进 的 距离 比率 不 大 于 3/2， 因 此 仅 对 交 于 
4G 段 的 情况 进行 分 析 。 

根据 混合 段 的 定义 ， 无 论 P 向 上 还 是 向 下 移动 ，t/zt 或 /zw 都 不 大 于 3/2。 所 以 ， 只 考虑 纯 
净 段 的 情况 。 以 第 波 为 例 ， 假 设 它 的 标记 是 向 上 ， 且 P 在 直线 st 之 上 。 标 记 为 向 下 的 情况 与 
此 相似 ， 令 aj (> RPL (向 下 ) 遇 到 第 起 所 在 方形 的 边 长 之 和 ， 那 么 相对 于 第 起 P 移 动 
的 总 距离 为 a Tt + b; Tt ， 而 相对 于 第 段 0 移 动 的 总 距离 为 a mi +b.m,, KPT, T, mX 
些 量 都 是 相对 于 一 个 单位 方形 第 起 的 最 低 点 。 那 么 

a; 


LT +T, 
at,+bt, b; 





A D 


图 12-21 tw 十 有 最 坏 值 的 情况 


an +b, fi n, +m, 
b, 


现在 的 问题 是 : TESA? 注意 a; 和 b; 都 是 相对 于 用 在 算法 中 的 平衡 参数 。 总 之 ，p;b; 


是 从 平衡 参数 balance 中 减 去 的 量 而 a 是 加 上 的 量 。 由 于 平衡 参数 balance 不 能 是 负数 ， 可 得 
pib; <a; AEF BRA L, REEE T/T <3/2, 


接着 讨论 POT 的 上 界 。 
pti +, 
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oT +T 
PT +t, _ IO; 
DJ'i 
PA +H, ata, 
ICJ; 


1D1Imn+1C71r， 
| DJ! 1a, + IC I 


假设 有 一 个 单位 方形 ， 那 么 上 式 的 分 子 
IDJ lti +C; IT, 


= (1AJ,|+tany)(2-1AJ, )+ (1-1 AJ, l- tany )(l+1 AJ, I) 


l 


cosy 





(siny + cosy) + 2(cosy -siny )l AJ, |-2cosy(1 AJ, !)”) 


AAJ l=y, sinp=a, cosp=b, A 


上 式 的 分 母 为 


IDJ lt +I CJi iT, 


- a +b)+ 2b- a)y- aby’) 


| DI! 1x, +1CI/\ x, 


=(lAJ,|+tany (siny + cosy -l AJ, lsinw)+(J- | AJ, |-tany )(cosy—| AJ, lsiny) 





cosy 





(sin? y + cos’ y) 


IDJ'it +1CH lt, 


=(a+b)+2(b-a)y-2by’ 
IDJ! a +1C 1x 


A fly) = (a + b) + 2(b—-a)y—2by’, ABZ 


fO) = 2(b—a)—4by 


4 y= = 时 ，Xy) 取 得 最 大 值 。 








2 
/ty 
(arb Ora _ (b= ay" 

b 2b 
(b-ay 
2b 
2b +b +a 
2b 


=(a+b)+ 
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由 于 a* +b = siny + cosy= 1， 可 以 得 到 











Fl ba 22h! 
\bp) 2 
因为 b =cosp, wxal4, (3 
(b-a\ _ 2b* +1 3 
A b) 2 `? 
这 样 ， 
OT +T, <2 
On +X, 2 


易 知 上 述 不 等 式 对 所 有 边 长 为 (万 1) 的 方形 障碍 物 也 成 立 ， 因 此 可 得 


PT, tT, < 3 
pA, +2, ~ 2 
2p; T, + 2t,<3p,m, + 3m, 
(32,-21,)p, 2 27,—3n, 


(3x,—27) 2 21,-3m, (根据 p;b, <a; ) 





ntt, 3 3 
~ <> (i 2 <5 | 
Butt 2 t 2 


假设 搜寻 者 P 与 某 个 障碍 物 第 ; 段 的 最 低 点 相遇 ， 如 果 他 位 于 障碍 物 的 第 i 段 内 的 某 点， 每 
次 这 种 情况 出 现时 ， 都 会 有 O(L Vd) 偏差。 注意 ，d 为 直线 ;一 ! 的 长 度 ， 且 每 个 方形 的 大 小 限制 
于 某 个 常数 c(<1)， 那 么 最 坏 情 况 下 会 遇 到 0O() 个 方形 。 因 此 ， 总 偏差 为 O( Vd )。 

接 下 来 ， 在 运用 规则 6 到 达 ! 的 时 候 ， 需 要 知道 搜寻 者 P 到 直线 ?一 ! 之 间 的 距离 。 假 设 P 位 于 
直线 s-! 之 上 且 交 于 第 段 。 很 明显 ， 如 果 第 ; 段 的 标记 为 向 下 ， 那 么 它 就 越 接近 直线 s 一 +。 考虑 第 
i 段 的 标记 为 上 的 情况 ， 那 么 P 要 向 上 。 根 据 定义 ， 为 平衡 第 让 .而 增加 的 次 数 不 超 过 p; +1， 在 直 
线 * 一 /之 上 的 竖 直 距离 为 ICJ4x (p; +1)<1， 其 中 1CJi1 为 P 与 第 波 相 过时 ， 离 开 直线 一! 的 竖 直 距 
离 。 由 于 每 个 障碍 物 分 为 Yd 段 ， 在 应 用 规则 6 之 后 ， 搜 寻 者 P 与 ;直线 间 的 距离 最 多 为 Vd 。 

基于 上 述 讨 论 可 知 ，P 与 8 移动 的 距离 之 比 不 会 超过 


3 1 
2+ (qq) 

如 果 d 足 够 大 ， 那 么 比率 不 会 超过 3/2。 这 样 ， 可 以 得 到 P 移 动 的 总 距离 不 会 超过 0 移动 路 
离 的 3/2。 因 此 ， 在 线 算法 是 3/2 可 竞争 的 。 

在 上 述 讨论 中 ， 已 证 明 在 线 穿越 障碍 算法 的 竞争 比 是 3/2。 接 下 来 将 证 明 该 算法 是 最 优 的 。 
假设 障碍 物 为 矩形 ， 令 "表示 和 矩形 的 长 宽 之 比 。 我 们 将 证 明 解 决 穿越 障碍 问题 的 任何 在 线 算法 
的 竞争 比 小 于 (r/2 +1) 是 不 可 能 的 。 在 上 面 的 例子 中 ， 假 设 障碍 物 为 方形 ，r = 1。 这 样 ， 竞 争 
比 不 可 能 小 于 3/2， 故 该 在 线 算法 是 最 优 的 。 

为 找 出 竞争 比 的 下 界 ， 要 对 障碍 物 有 特殊 的 安排 。 图 12-22 说 明了 障碍 物 的 特殊 布局 。 令 
n 是 一 个 大 于 1 的 整数 ， 如 图 12-22 所 示 ，s 和 1 的 坐标 分 别 为 (0，0) 和 (2n，0)。 注 意 在 障碍 物 之 
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间 ， 有 无 限 小 的 缝隙 以 隔离 障碍 物 及 供 搜寻 者 在 障碍 物 之 间 通 过 。 显 然 ， 搜 寻 者 既 可 水 平移 

















动 也 可 竖 直 移动 。 
WH 
ET HHH H EEE 
REEL t tt Ht 
THREAT 





H, 
(2n, 0) 
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HATE 
i i i i 











图 12-22 障碍 物 的 特殊 布局 


障碍 物 以 纵队 形式 排列 ， 有 两 种 纵队 b 和 c。 每 个 bp 纵队 有 无 穷 多 个 障碍 物 组 成 ， 而 c 纵 队 
只 包含 8 个 障碍 物 ， 每 个 p 纵 队 与 c 纵 队 间 隔 排列 ， 第 i 列 以 @) 纵 队 记 为 六 (ci)。 

对 于 1<i<n， 根 据 搜寻 者 如 何 与 b; 相遇 的 位 置 来 安排 第 c; 纵队 上 障碍 物 的 位 置 。 令 搜寻 
者 P 与 第 b; 纵 队 中 相遇 的 障碍 物 为 a; ，pi 是 P 与 第 b; 纵 队 的 障碍 物 a; 相 遇 的 点 ， 那 么 在 c; 纵 队 中 
的 八 个 障碍 物 安排 成 a 位 于 它们 的 中 间 。 图 12-23 所 示 为 障碍 物 的 一 种 可 能 排列 ， 其 中 的 粗 线 
表示 搜寻 者 P 经 过 的 轨迹 。 


p 











图 12-23 图 12-22 布 局 中 P 的 移动 路 线 
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显然 ， 从 Pi 到 P; 的 最 短路 径 长 度 至 少 为 +2。 

因此 ， 搜 寻 者 忆 遍 历 的 总 距离 至 少 为 (六 +2)n。 

对 于 任意 0<m< Yn ， 定 义 水 平 线 己 ,为 同 ， y= (8m +1/2)r, 

ZE, HFEA, KFL, 不 与 b; 中 的 任意 障碍 物 相交 ， 而 可 与 c; 中 的 某 一 障碍 物 
相交 。 由 于 在 任何 两 条 直线 L,, 和 已, 间 的 距离 至 少 为 8r， 故 它们 不 可 能 相交 于 同一 纵队 c; 上 的 
障碍 物 。 因 此 ，L。，L，…， 古 ,| 最 多 交 寺 1，c;，…，c 中 的 n 个 障碍 物 。 由 于 有 ~n 条 直线 
并 相交 7 个 障碍 物 ， 那 么 平均 每 条 线 与 w Yn = Vn 个 障碍 物 相交 ， 即 至 少 存在 一 个 整数 m<Vn， 
使 得 L, 与 cj，c:，…，cu 中 的 Vn 个 障碍 物 相交 。 对 任意 可 行 解 ， 水 平 距离 至 少 是 24。 由 于 每 
个 障碍 物 的 长 度 是 +-， 每 次 遇 到 一 个 障碍 物 ， 都 遍历 距离 cr(c 为 一 常数 )， 故 构建 可 行 的 路 径 长 





2n + cr Vn 对 某 个 c 
最 终 ， 可 得 解决 穿越 障碍 问题 的 任意 在 线 算法 的 竞争 比 至 少 为 
r+n 
2n+ncyn 


如 果 n 很 大 ， 那 么 竞争 比 至 少 变 为 r/2 +1, 
如 果 r = 1， 那 么 竞争 比 为 3/2。 


12.4 用 补偿 策略 求解 在 线 二 分 匹配 问题 


这 本 节 中 ， 讨 论 二 分 匹配 问题 (bipartite matching problem)。 给 定 一 个 将 顶点 集 二 分 为 R 
和 8 的 二 分 带 权 图 (bipartite weighted graph) G， 每 个 集合 的 基数 为 +。 二 分 匹配 M 是 边 E 的 子 
集 ， 在 这 个 集合 中 没有 两 条 边 同 时 邻接 到 一 个 单独 顶点 上 ， 且 每 条 边 都 邻接 R 和 8B。 匹配 的 代 
价 指 在 这 次 匹配 中 边 的 权 值 之 和 。 最 小 二 分 匹配 间 题 是 找 出 最 小 代价 的 二 分 匹配 。 在 本 节 中 ， 
只 研究 最 小 二 分 匹配 问题 。 

二 分 匹配 问题 的 在 线 算 法 描述 如 下 : 集合 R 中 的 顶点 预先 已 知 ， 而 集合 8 中 的 顶点 则 是 依 
次 出 现 。 当 8B 中 的 第 i 个 顶点 出 现时 ， 它 必须 与 R 中 尚未 匹配 的 顶点 匹配 ， 且 此 决策 随后 不 能 改 
变 。 目 标 是 保持 在 线 匹配 代价 低 ， 对 于 数据 也 提出 一 个 特殊 的 约 东 ; 所 有 边 的 权 值 都 满足 三 
角 不 等 式 。 

接 下 来 ， 首 先 证 明 从 最 小 二 分 匹配 算法 中 导出 的 代价 下 界 ， 然 后 证 明 所 有 最 小 二 分 在 线 
匹配 算法 的 代价 都 小 于 最 优 离线 匹配 算法 代价 的 (24 一 1) 倍 。 

Sbi, by, +, b, 为 集合 B 的 n 个 顶点 ，r; O<i<n) 表示 当 b; 出 现时 与 5; 匹配 的 顶点 ， 使 
用 图 12-24 来 说 明 二 分 图 。 

如 图 12-24 所 示 ， 二 分 图 具有 如 下 的 特征 : ! 

(1) 对 于 所 有 的 i， 边 (b,，r;) 的 权 值 为 1。 

(2) 对 于 i = 2，3，…，n， 如 果 j<i， 那 么 
Ab, r ) 的 权 值 为 0。 

G) MFi=2, 3, =, n, MRSi, MA 
边 (b; ,rj ) 的 权 值 为 2。 

如 果 b,，b,，，…，b, 是 依次 出 现 ， 那 么 任意 
在 线 算法 总 的 匹配 代价 为 1 +2(n 一 1) =2n 一 1。 o> n 

二 分 图 的 最 优 离线 匹配 过 程 如 下 : 图 12-24 证 明 在 线 最 小 二 分 匹配 算法 下 界 的 二 分 图 
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1 与 b 相 匹配 ， 代 价 为 0， 
r “pb FAIA, EAT AO, 


r, ‘gb AADAC, GT AL. 

因此 ， 离 线 算法 的 最 优 代价 为 !， 这 意味 着 没有 在 线 二 分 匹配 算法 获得 小 于 2n 一 1 的 竞 
争 比 。 

现在 说 明 在 线 二 分 匹配 算法 。 在 线 匹配 算法 基于 离线 匹配 算法 ， 下 面 举 例 说 明 。 

参见 图 12-25 所 示 的 R 集 ， 所 有 的 点 都 没有 标记 。 两 点 之 间 边 的 权 值 为 这 两 点 间 的 儿 何 
距离 。 7 

BLE, R12-26P pas Ay ab POL, FE fal Be OE CA AR BD A BRR 
一 般 性 ， 设 该 点 为 r,， 在 线 匹配 算法 也 如 最 优 离线 算法 那样 将 bi 与 r, 相 匹配 。 


© bi@ Or, 


图 12-25 R 集 图 12-26 b HIS 
图 12-27 中 所 示 的 是 5 出现。 任何 最 优 离线 算法 将 bs 与 , 相 匹 配 ， 而 将 b1 与 R 中 一 个 新 点 匹 
配 。 不 失 一 般 性 ， 令 该 点 为 r.。 问 题 是 ， 在 线 匹配 算法 会 执行 哪 一 匹配 呢 ? 


由 于 在 线 匹 配 算 法 已 将 b, 与 "匹配 ， 不 能 改变 这 个 事实 。 为 了 补偿 ， 将 b, 与 新 的 顶点 r2 相 
匹配 。 


最 后 ， 如 图 12-28 所 示 己 出 现 ， 最 优 离线 算法 将 乌 与 六 匹配 ，2 与 R 中 新 增加 的 顶点 六 匹配 ， 
b; 与 7, 匹 配 。 


@b 
@b, 2 


o? OF 


图 12-27 b, 出 现 图 12-28 b H 


在 线 二 分 匹配 算法 注意 到 /是 新 增加 的 顶点 ， 所 以 将 by 与 "匹配 。 
在 图 12-29 中 ， 将 最 优 离线 匹配 与 在 线 算法 进行 了 比较 。 


Fl 


最 优 离线 匹配 





图 12-29 在 线 与 离线 匹配 的 比较 
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现在 正式 地 定义 在 线 算法 。 假 设 在 b; 出 现 之 前 ，b,，5;，…，bi .已 经 依次 出 现 ， 不 失 一 - 
般 性 ， 遂 过 在 线 匹配 M; ,分 别 与 "+,，7，，…，ri! 相 匹配 。 当 4b; 出现 时， 考虑 匹配 集 M;'， 满 足下 
列 条 件 : 

(1) Mi 是 {pi，b,，…，bi) 与 71，r，,，… ,Ti 之 间 的 最 优 二 分 匹配 集 。 

(2) fE{b,, by, ee, BSI, r ns r; 之 间 所 有 的 最 优 二 分 匹配 集中 ， IM,' 一 M';_ ,| 是 最 
小 的 。 

令 R, 表 示 在 M; 中 R 的 顶点 集 ， 可 证 明 R; 仅 比 R;_ ,增加 一 个 顶点 。 不 失 一 般 性 ， 假 设 x; 是 b， 
出 现 后 增加 的 顶点 ， 也 就 是 ，R; = {ri, ro. oy ri, Ti Yo 由 于 在 M ,中 ， 对 于 j = 1, 2, 
i 一 1 ,vj 已 经 与 b; 相 匹配 ， 为 了 补偿 ， 在 M, 中 将 x; 5b, 相 匹 配 。 

初始 时 ，M = Mi'。 

现在 讨论 在 线 算法 的 一 个 有 趣 特性 。 在 线 算法 产生 一 个 匹配 序列 M'，M2，…，M,。 现 在 
EM @ M'; ,， 其 中 的 每 条 边 是 MM' 和 M'; ,其 中 之 一 的 边 。 例 如 ， 图 12-30 所 示 的 集合 。 


thy 


M M MOM, 


1 2 
r @o—®°, r ->< b, r b, 
e@ ©’ r, b, r b 
"@ @7, "® @b, e @4. 


图 12-30 M'@M,,; 


AE, ME, 是 两 个 边 集 ，E; © E 的 一 条 交替 路 径 (alternating path) (WWA) EEE ME, 中 
交替 出 现 边 的 一 条 简单 路 径 ( 环 路 )。 边 在 E; ME 中 交替 出 现 。 最 大 交替 路 径 (maximal 
alternating) ( 环 路 ) 是 指 在 这 个 交替 路 径 〈 环 路 ) 中 没有 子路 径 ( 子 环 路 )。 对 于 M; @ M'a 
仅 有 一 条 以 b; 为 终点 的 最 大 交替 路 径 ， 即 

rb >r, >b, 

类 似 地 ， 在 My © MM; 中 仅 有 一 条 以 5b; 为 终点 的 最 大 交替 路 径 ， 即 

r, >b, >r; >b >r: >b, . 

现在 要 证 明 : 对 于 i = 2，…, n， 在 M'.,@ Mi 中 ， 只 有 一 条 最 大 交替 路 径 且 这 条 交替 路 径 
以 b; 为 终点 。 

令 H 是 M'，,@ M,'， 首 先 注意 下 面 : 

(1) 在 中 6 的 度 为 !， 因 为 b; 是 新 出 现 的 顶点 ， 且 它 必 须 与 R 中 的 某 一 顶点 相 匹 配 。 

(2) 对 于 bp，(1<j<i-1)，H 中 b, 的 度 要 么 为 0 要 么 为 2。 如 果 b) SRPREM' LEM, Dial 
一 个 顶点 相 匹 配 ， 在 H 中 b) 的 度 为 0; 否则 ， 因 为 M';_ 中 的 一 条 边 与 M;' 中 的 一 条 边关 联 于 b, ， 
所 以 它 的 度 为 2。 

(3) 由 于 对 于 任 一 r; r 的 度 可 为 0、1 或 2。 对 此 的 证 明 可 分 为 两 种 情况 : 

情况 3.1: x 不 与 M'_ 和 Mi;' 中 任 一 顶点 匹配 ， 在 这 种 情况 ,rj 在 H 中 的 度 为 0。 

情况 3.2: 7, 与 某 一 顶点 相 匹 配 。 在 此 情况 下 ， 如 果 它 与 M' 或 Mi 中 的 某 一 顶点 匹配 ， 而 
不 与 两 个 集合 中 的 顶点 匹配 ， 那 么 可 以 证 明 r) 在 HH 中 的 度 为 1!， 如 果 它 与 M'_ 和 Mi;' 中 同一 个 点 
匹配 ， 那 么 它 的 度 为 0， 如 果 它 与 M'; 和 Mi' 中 不 同 的 两 个 点 匹配 ， 那 么 它 的 度 为 2。 
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BEHT, PEAJE- EE- PKR ERA. TD 的 度 为 1， 也 一 定 存 
在 以 b; 作 为 终点 的 交 赫 路 径 。 令 P 表 示 这 条 路 径 ， 可 以 证 明 在 H 中 没有 别 的 连通 分 支 。 换 句 话 
说 ，P 是 8 中 唯一 的 连通 分 支 。 

首先 假设 H 中 包含 一 条 最 大 交替 路 径 L， 其 中 L 取 P。 因 为 LP， 且 P 是 以 b; 作 为 终点 的 队 
RAKE, Bib, PELE. HAB, 一 {b; } 中 的 每 个 顶点 的 度 为 0 或 2， 且 R 中 每 个 顶点 
的 度 为 0、1 或 2， 所 以 上 的 两 个 终点 必 在 R 中 ， 且 L 的 边 数 一 定 是 偶数 。 另 外 ，L 在 R 中 的 顶点 数 
要 比 在 B; 一 {4b;} 中 的 顶点 数 多 1。 不 失 一 般 性 ， 令 在 L 中 包含 2m 条 边 ， 其 中 1<m<i-1, RE 
路 径 L 上 的 顶点 序列 为 r，， bis Fa, ba, es Fms Bins Ts Hr Fr, ,为 L 的 终点 。 Vig Tay “Ts 
和 x TER, bi, by, ++, Fb, 在 —{b, } 中 。 BA (A; 1 表示 中 属于 AM" (M,..) DE. 不 失 
一 般 性 ， 假 设 A; = {(bi, r), (bas r), tty (Bans tn ES Ami = {bis ra), (Bae r3), 0, (Ons 
r+)}。 注 意 在 BH 中 ， 由 于 R 中 度 为 1 的 顶点 只 与 M; ,或 Mi 相 匹 配 ， 故 端点 六 只 与 Mr 中 的 点 相 匹 
配 ， 端点 ri 只 5M, "中 的 点 相 匹配 。 换 句 话说 ，M; (Mi 站) 是 B= {bi， by, *…, b;}(B, ,= {b, 
ba, oe, bi DIR Hrn wR 一 {71)) 的 子 集 相 匹配 的 边 集 。 

由 于 4; 是 {bp ，…，bi} 与 {71，… 7} 匹配 的 边 集合 ， IRAM; -A B, —{b,, 00, ba) 
R= 4r, ts Fumo +} 的 子 集 匹 配 的 边 集合 ， HFA {b es DaB o Faa PERE 
的 边 集 合 ， 那 么 (M: 一 4 UA Eb, 与 R 一 {7,} 的 集合 匹配 的 边 集 合 。 类 似 地 ， 可 证 明 (M';_ ,一 
A, DUA; 是 B 1 与 R 一 {7 4} 的 子 集 匹 配 的 边 集合 。 令 W(5) 表 示 边 集合 5 的 总 权 值 ， 那 么 对 于 L 有 
三 种 情况 : 

* WA,)>W(A.,.)) 

在 这 种 情况 下 ， 存 在 匹配 M" = (M;'— A, UA; |,， 使 得 WM,")<WOM,)。 这 与 Mi 的 最 小 性 相 
了 矛盾。 

° WA; )<W(A;.,) 

在 这 种 情况 下 ， 存 在 匹配 M" , = (M'i AUA; SER WOM", DWM). XM 
小 性 相 了 矛盾 。 

e W(A;) = W(Ai 1) 

在 这 种 情况 下 ， 存 在 匹配 Mi" = (M;'—A,)UA,,, fEPRIM,"-M'_I<IM'-M'_ i。 这 与 Mi;' 是 
Mi 一 Mi 中选 出 的 最 小 边 数 相 予 盾 。 

因此 ， 在 H 中 除了 P 外 再 没有 最 大 交替 路 径 。 

FALA, M'i © Mi' 由 只 包含 一 条 以 bi; 为 终点 的 最 大 交替 路 径 P 所 组 成 。 

由 于 H 仅 由 一 条 最 大 交替 路 径 P 所 组 成 ， 且 4b) 的 度 为 0 或 2， 其 中 1<j<i-1， 故 R 中 必 存 在 
一 个 度 为 1 的 顶点 r' 作 为 P 的 端点 ， 而 R 一 {7 中 所 有 顶点 的 度 为 0 或 2。 

此 外 ，P 中 边 数 一 定 为 奇数 。 因 此 ， 连 接 到 端点 户 的 边 与 连接 到 ~ 的 边 都 来 自 同一 个 边 集 
合 。 由 于 连接 到 b; 的 边 是 M,' 中 的 一 条 边 ， 连 樟 到 7' 的 边 也 是 M,' 中 的 一 条 边 。 注 意 在 BH 中 ，R 中 
度 为 1 的 顶点 匹配 M" 和 M' ,中 之 一 。 因 此 ,rr' 在 MM,' 中 匹配 。 在 有 中，R 一 {7 小 中 度 为 0 的 顶点 与 
b; 的 同一 个 顶点 匹配 ， 或 者 既 不 与 Mi' 也 不 与 M., 匹 配 ，R 一 {7} 中 度 为 2 的 顶点 与 在 Mr 和 Mi ， 
中 不 同 的 b; 顶 点 匹配 。 也 就 是 ，R 一 {7 人 中 的 顶点 或 者 都 在 或 者 都 不 在 M,' 和 M'i_, 中 匹配 。 所 以 ， 
r'ÆR, 一 R， ' 中 唯一 的 顶点 ， 故 对 于 1<i<n, IR -Ral 1。 

上 面 的 讨论 是 非常 重要 的 ， 因 为 它 是 补偿 策略 的 基础 。 在 本 节 介 绍 的 在 线 算法 只 当 B 中 的 
新 元 素 出 现时 起 作用 ， 与 先前 的 最 优 匹配 相 比 ， 新 的 最 优 匹 配 只 增加 了 R 中 的 一 个 新 元 素 。 

已 经 证 明了 在 线 算法 的 有 效 性 ， 接 下 来 讨论 在 线 算法 的 性 能 。 将 证 明 算 法 是 (2n 一 1) 可 竞 
争 的 。 也 就 是 ， 令 C(M) 和 C(M,') 分 别 表示 M, 和 Mi 的 匹配 代价 ， 那 么 

COM, ) < (2n—1)C(M,')。 





326 £1¢ 





依据 归纳 证 明 ， 当 i= IT, BSR, C(M,)=C(M,'), PLA, 

C(M, )< (2i— DC(M,") 

假设 上 面 公式 对 于 i = 1 成 立 ， 且 在 M, F, b 5, 匹配 。 令 Mi; "表示 MU (b; , rj), Hi 表 
IRM; ® Mi "。 由 于 匹配 Mi 和 AM,;" 是 六 GRA SER, 相 匹 配 ， 故 Hi' 中 的 每 个 顶点 的 度 为 0 或 2。 在 
继续 证 明之 前 ， 先 看 一 些 例子 。 

对 于 如 图 12-30 所 示 的 例子 ，M" = MU (b;, 7) 表 示 在 图 12-31a 中 ，H,' = M,' ®© Ms" 表示 
在 图 12-31b 中 。 


由 于 在 所 中 每 个 顶点 的 度 为 0 或 2， 所 以 对 gg, ee: 
于 H 有 两 种 情况 : =< 
情况 1， 所 有 已 ' 中 顶点 的 度 都 为 0。 » @—_®’. n by 
在 这 种 情况 下 ，M:" 和 AM:" 是 相同 的 ， 因 此 ， a) b) 
(b;, 1; ) 必 定 属于 M;'， 令 d(b; ， rj) 表示 b; 到 +) 之 图 12-31 对 于 图 12-30 情 况 的 M," 和 HH 


EES, AbAd(b,, r;)<C(M,). 
HF C(M'_, aE fi, FT d(b;, 1; )<C(M;') + C(M'.,). 
情况 2: HFAA. iE 
db; , 1,)<C(M;') + C(M;) 
对 此 情况 证 明 从 略 。 
由 于 CCAf )—C(M,..,) = d(b;, 7,), AVF 
C(M;) —C(M_,) =d(b;, 7; <C(M'_.) + C(M’), 
C(M,)<C(M,.,) + C(M'_.) + C(M;’) 
<(2(i-1)—1)C(M'_,) + CCM". ,) + CCM’) (根据 归纳 假设 ) 
<(2(i-1)—1)C(M',) + 2C(M,’) (根据 CCM'i_) <C(M’)) 
<(2i-1)C(M;), 
由 上 面 证 明 可 知 该 算法 是 (2n 一 1) 可 竞争 的 。 那 么 问题 是 : CHERAB? 在 本 节 
开始 的 论述 可 知 非 在 线 最 小 二 分 匹配 算法 可 取得 竞争 比 小 于 (2n 一 1)， 故 基于 补偿 策略 的 在 线 
算法 是 最 优 的 。 


12.5 用 适中 策略 解决 在 线 m 台 机 器 调度 问题 


在 本 节 中 ， 将 描述 基于 适中 策略 (moderation strategy) 解决 在 线 m 台 机 器 调度 问题 (on- 
line m-machine scheduling problem) 的 算法 。 在 线 m 台 机 器 调度 间 题 定义 如 下 : 已 知 m 台 相同 
的 机 器 及 依次 到 来 的 任务 ， 且 当 第 个 任务 到 达 时 已 知 它 的 执行 时 间 。 只 要 有 任务 到 达 ， 就 必 
须 立 刻 给 它 分 配 其 中 一 台 机 器 执行 。 目 标 是 在 m 台 机 器 上 无 优先 级 地 调度 所 有 的 任务 ， 以 最 小 
化 到 最 后 任务 完成 时 间 的 时 间 跨 度 。 

一 个 直接 的 实现 方法 是 贪心 法 ， 通 过 下 面 的 例子 说 明 。 考 虑 六 个 任务 ji ja ojos AR 
它们 的 执行 时 间 分 别 为 1，2，…，6。 贪 心 法 把 到 达 的 任务 以 最 小 的 总 处 理 时 间 方 案 分 配给 不 
同 的 机 器 。 最 终 的 分 配 如 图 12-32 所 示 。 

如 图 12-32 所 示 ， 在 这 种 情况 下 ， 最 长 的 完成 时 间 为 9， 经 常 地 表示 为 时 间 跨 度 。 如 果 不 
采用 贪心 法 ， 那 么 时 间 跨 度 可 缩短 。 如 图 12-33 所 示 的 调度 方案 ， 时 间 跨 度 为 7。 

上 述 基于 贪心 法 的 算法 称 为 列表 算法 (list algorithm)。 可 以 证 明 该 算法 是 (2-1/m) 可 竞 
争 的 。 接 下 来 介绍 基于 适中 策略 的 算法 。 当 m 之 70 时 ， 该 算法 是 (2-1/70) 可 竞争 的 。 所 以 ， 
该 算法 在 m 宇 70 时 ， 其 性 能 比 列表 算法 更 优 。 
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1 4 1 6 
he 一 一 一 "| ke 一 一 ”一 | 
Le 1: Ji 机 器 1: Ji | Je 
e -l A > 
机 器 2， | is | js | 机 器 2: j | Js | 
ES 6 -| hk 3 一 人 
- m~ - 
HLAS: [ J | Je | 机 器 3: aj | J4 
图 12-32 mm 台 机 器 调度 问题 实例 图 12-33 图 12-32 中 例子 的 更 好 调度 


基本 上 ， 适 中 策略 不 是 将 到 达 任务 分 配给 处 理 时 间 最 短 的 机 器 ， 而 是 尽量 分 配 到 来 任务 给 
处 理 时 间 处 于 中 间 的 机 器 ， 既 不 太 长 ， 也 不 太 短 。 这 就 是 为 什么 该 策略 称 为 适中 策略 的 原因 。 

现在 定义 几 个 术语 。 首 先 ， 令 ai 表示 第 ;个 到 达 任务 的 执行 时 间 ， 其 中 1<i<n。 Bim 
70, e= 1/70, S6d6€[0.445—1/2m), 0.445 + 1/((2m)]， 且 6m 为 整数 。 例 如 ， 如 果 m = 80， 那 么 
可 取 6 = 36/80， 它 满足 5 范围 的 定义 ， 且 sm = 36 是 一 个 整数 。 

机 器 的 高 度 (height) 定义 为 已 分 配 到 该 机 器 上 的 所 有 任务 的 长 度 总 和 。 在 任意 时 刻 ， 算 
法 都 会 根据 机 器 当前 的 高 度 将 它们 排序 成 一 个 
韭 递 减 序 列 。 在 时 刻 i， 也 就 是 ， 当 第 ;个 任务 ma O 
被 调度 时 ， 可 将 该 机 器 序列 分 为 两 个 子 序列 ， 
LIMIR, 。R; 是 序列 中 前 6m 台 机 器 子 序列 ，L; 是 
剩余 的 m 一 6m 台 机 器 子 序列 ， 如 图 12-34 所 示 。 图 12-34 LAIR, 

令 L 和 R 的 高 度 序列 分 别 记 为 Lh, FARA, ，A; 和 M; 分 别 表示 在 时 刻 i，m 台 机 器 的 平均 高 度 和 
最 小 高 度 ，A(P) 和 MCP) 分 别 表示 在 序列 P 中 的 平均 高 度 和 最 小 高 度 ， 其 中 P 是 一 个 高 度 序列 。 

基于 适中 策略 的 m 台 机 器 调度 问题 的 在 线 算法 描述 如 下 : 

当 第 i +1 个 任务 到 达 时 ， 若 MM(Lh,) + a a SDAR), BARE +1 个 任务 分 配给 的 
第 一 台 机 器 ， 否则， 将 它 分 配给 R, 的 第 一 台 机 器 ， 即 两 个 子 序列 机 器 中 高 度 最 小 的 机 器 。 如 
果 必 要 ， 可 对 机 器 重新 排列 ， 使 得 高 度 保持 非 递减 。 

楼 下 来 证 明 上 述 在 线 算法 是 (2s) 可 竞争 的 。 该 证 明 是 相当 复杂 的 ， 这 里 不 提供 完整 的 证 
明 ， 只 介绍 证 明 的 主要 部 分 。 

令 ON, OPT, 分 别 表示 在 上 时刻 在 线 算法 和 最 优 算法 的 时 间 跨 度 。 假 设 算法 不 是 (2-- 旨 可 竞 
争 的 ， 那 么 存在 一 个 ! 使 得 

ON <(2—e)OPT, 和 ON, ,, >(2—e) OPT, ,, 


考 虚 M(Lh, ) 和 A(Rh, )。 假 设 M(Lh, ) + @,,,<(2-€)A(Rh,), BARRA Ha, ,, 放 在 L; 中 高 
度 最 短 的 机 器 上 ， 因 此 
ON, + = M(Lh,) + Gy 4) 
<(2~£)A(Rh, ) 
<(2-£)A, 
<(2-€)A, ,, (12-3) 
因为 OP7 对 于 任务 a,，a,，…，a; 来 说 是 最 优 时 间 跨 度 ， 所 以 得 到 m x OPT, >a, +a, +*… 
+a;=mxA, > 因此 ， 





OPT, >A, (12-4) 
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把 式 (12-4) FLAK (12-3) 中 ， 得 到 
ON ..<(2~£)OPT,,, (12-5) 


这 与 假设 相 了 矛盾。 因此 ， M(Lh, ) +a, <(2—e)A(RA, ), 且 在 线 算法 把 a ,, 放 在 高 度 最 短 的 机 
器 上 。 所 以 ， 


ON, 4 = M+ ai (12-6) 
现在 接着 证 明 M, >(1~s) A, 。 假 设 M <(1—-£) A,, BA 
ON, =M, +a, (RH 公式 (12- 6)) 


<(1-e) A, + 4,,, 
<(1-e) Ay 41 + 4,4) 
ALAA, .,<OPT,,,#la,,,< OPT, ,,, 所 以 
ON, a < (2—8) OPT,,, 
由 于 假设 ON, ,,>(2—2) OPT, a, 所 以 是 不 可 能 的 。 因此 ， 得 到 
M, > (1-2) A, (12-7) 
不 等 式 (12-7) 表明 ， 在 时 刻 ! 执 行 时 间 长 度 最 短 的 机 器 高 度 比 (1 一 a)4, 更 长 。 事 实 上 ， 可 
以 证 明 一 个 更 强 的 结论 : 在 时 刻 :， 每 台 机 器 包含 的 任务 执行 时 间 长 度 至 少 》 


之 





(i-e) 


a Mico: 后 面 将 提供 对 它 的 证 明 。 这 里 先 假设 其 为 真 ， 这 样 很 快 建立 起 算法 是 〈2 一 :) 可 竞 


争 的 。 
对 于 a,,,， 有 两 种 可 能 的 情况 。 
a 所 (1 一 ejM, ， 那 么 
ON, = M+ 4,4; (根据 公式 (12-6)) 
<(2—£)M, 
<(2—£)M,,, 
<(2—-s)OPT, ,, 
3% 5ON, a > (2-8) OPT, ., 相 了 矛盾。 
当 a > (1—e) M, Bt, 
a,,, > (1—£) M, 
M 。 (#89 > 


1 1 ) 
> 一 -一 -一 -一 - 
2(1 -2) 2(1— 5) 


由 于 在 时 刻 ! 每 台 机 器 执 TARIE KEEDA zap 的 任务 ， Ha 255 可 M, ; 
所 以 至 少 有 m +1 个 任务 的 执行 时 间 总 长 度 至 少 为 了 可 z” ， 其 中 必 有 两 个 任务 在 同一 台 机 
器 上 。 所 以 


1 
OPT, ,, 2 esto! 
这 样 ， 
ON, a = M, + ai, (根据 公式 (12-6)) 


<(1~e)OPT,,, + OPT, ， (Biau <OPT, +1, 及 M, <or7- | 


_ 1 
2(1 -5) 





A R Hk 329 








= (2 一 e)OPT, +1 


这 也 与 ON,,, > (2—e)OPT, , AHF E. 
无 论 哪 种 情况 都 有 矛盾 ， 所 以 ， 该 在 线 算法 是 (2 一 e) 可 竞争 的 。 


现在 证 明 更 强 的 结论 ， 在 时 刻 :， 每 台 机 器 上 含有 长 度 至 少 为 sac 的 任务 。 为 了 证 


明 该 结论 ， 注 意 上 面 已 证 明了 AM, > (1-s4, 。 由 此 ， 必 定 存在 时 刻 r<+，R. 中 的 机 器 在 时 刻 r 的 
高 度 至 多 为 (1 一 2)4,。 

邻 TE[0.14 一 1(26m)，0.14 +1/(26m)]，m 为 整数 。5; 和 Sh; 分别 表示 在 时 刻 :，m 台 机 器 的 最 
小 高 度 序列 和 它们 的 高 度 序列 ，s 表 示 只 有 在 8, 中 的 及 其 有 至 多 为 (1 一 e)4, 高 度 的 了 时刻 。 易 知 
r<s<t, 

下 面 对 三 个 关键 时 刻 进 行 总 结 : 

(1) 在 r 时 刻 ，R, 中 的 机 器 的 高 度 至 多 为 (1 一 a)4,。 

(2) 在 s 时 刻 ，5, 中 的 机 器 的 高 度 至 多 为 (1 一 2)4, 。 

(3) Ætl, M, > (1 一 2)4,。 

图 12-35 对 上 述 三 个 时 刻 进行 了 说 明 。 





时 刻 r: [| 


时 Alls: 


EJ 


M,> 0-94, 


图 12-35 对 时 刻 r，s 和 1! 的 说 明 


更 进一步 注意 5,ER, ， 可 得 到 下 面 的 三 个 断言 : 


#1. 在 (时 刻 ，5, 中 的 每 台 机 器 含有 一 个 至 少 为 一 


2(1 - €) 
断言 2. 在 /时刻 ，R. 中 而 不 是 9, 中 的 每 台 机 器 含有 一 个 至 少 为 5 A, 的 任务 。 


4 大 小 的 任务 。 





WES EMA, LPH STE OA, WES. 

显然 ， 一 日 证 明了 上 述 三 个 结论 ， 也 就 证 明了 在 ! 时 刻 ， 每 台 机 器 含有 一 个 长 度 至 少 为 
gA. TERENE, HAAI MEANEN. 

-€ 


言 1 的 证 明 ， 因为 在 "时 刻 ，$, 中 的 每 台 机 器 的 高 度 至 多 为 (1-84,， 且 内 > (1-A, (A 
等 式 (12-7)), BASH AIBA, S. 中 的 每 台 机 器 至 少 要 接收 一 个 任务 。 令 p 为 5, 中 的 一 台 
机 器 ，j ,为 机 器 p 在 s 时 刻 后 接收 的 第 一 个 任务 ， 其 中 s < i<:-1。 由 算法 可 知 ， 该 任务 要 么 分 
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配 到 ZL; ,的 第 一 台 机 器 ， 要 么 分 配 到 所 有 机 器 中 执行 时 间 最 短 的 机 器 。 由 于 pES, ， 故 它 不 属于 
Lt。 所 以 ，p 必 是 在 i+1 时 刻 执行 时 间 最 短 的 机 器 ， 故 得 到 


M(Lhi) + ain > (2~€)A(Rh;) 


使 得 
a; n > (2—€)A(Rh, )~M(Lh,) (12-8) 
还 可 得 到 
A, >A, 
= (1—-d)A(Lh,) + dA(RA;) 
>(1-8)M(Lh,) + 54(RA ) 
M(Lh,)< ARA) es (12-9) 
此 外 ， 


A(Rh; ) > A(RA, ) 


= (1 一 DD)(R, 一 5, 的 平均 高 度 ) + TACSh, ) 
>(1-vI(1—£)A,] + tA(Sh,) 


(12-10) 
(EHAR, ~ S, 中 的 机 器 高 度 至 少 为 (1 一 2)4, ) 


这 样 可 得 
a;,, > (2—£)A(Rh, )-M(Lh,; ) (根据 不 等 式 (12-8)) 
> (2=8)A(Rh,)— | (根据 不 等 式 (12-9)) 


6 ô 
= 一 一 一 一 Rh.) - —— 
(2 e+ 5) al hy Te 


= (2-24 So J0- D0- DAJ TASA- 7A (根据 不 等 式 (12-10)) 


6 6 6 
-|[2-e+ s|t-na-0- 72544 :用 -站 As 


ô ô 
> 上 -总 ou 让 


l 
2(1- 5) 








由 于 ~0.51 ， 及 


ô ô 
(2-175 -D0 -1 


/2 工 ，0455 \ | o1 1) 0455 
(7-90 * T0455) 70A 70) i0455 
= 0.56 


对 于 s < i<1-1， 可 得 
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12.6 基于 排除 策略 的 三 个 计算 几何 问题 的 在 线 算法 


在 本 节 中 将 介绍 解决 三 个 计算 几何 问题 的 在 线 算 
法 。 它 们 分 别 是 凸 包 问 题 、 最 远 点 对 间 题 和 1 圆心 问题 。 
最 远 点 对 问题 (farthest pair problem) 定义 如 下 : 在 平 
面 内 点 集 5 中 找 一 对 点 ， 使 它们 之 间 的 距离 最 大 。 这 三 
个 在 线 算法 将 给 出 近似 解 ， 但 我 们 将 证 明 这 些 近似 解 与 
精确 解 很 接近 。 对 于 这 三 个 问题 ， 使 用 平行 线 遏 制 方法 
(parallel lines containment approach) , 参见 图 12-36 所 示 ， 
它 包含 一 个 凸 包 。 
设想 新 增 一 个 顶点 。 如 果 这 个 点 位 于 出 包 里 面 ， 那 
么 对 它 不 作 任何 处 理 。 这 意味 着 只 要 记 住 该 山 包 的 边 图 12-36 一 个 西 包 
界 即 可 。 如 果 这 个 点 位 于 凸 包 外 面 ， 那 么 当然 要 对 凸 
包 的 边界 进行 修改 。 
使 用 -- 组 平行 线形 成 输入 点 的 边界 ， 例 如 ， 如 图 12-37 所 示 ， 有 四 对 平行 线 ， 即 CL, 4), 
(hs b'), (hy L) 和 (4，A) ， 形 成 了 输入 点 的 边界 。 
在 任意 时 刻 一 个 点 p 到 来 时 ， 首先 查 看 它 是 否 位 于 边界 之 外 。 如 果 是 ， 则 对 边界 进行 修改 ， 
否则 把 不 包括 点 p 的 !; 和 六 看 作 一 对 平行 线 ， 不 失 一 般 性 ， 且 设 / 比 上 更 接近 p。 随 后 ， 不 改变 
斜率 将 其 平行 移动 到 点 p。 参 见 图 12-38，p 不 在 4 和 4' 之 间 ， 可 移动 /到 p。 





图 12-37 由 四 对 平行 线 组 成 的 边界 图 12-38 在 新 增 输入 点 后 平移 直线 


一 般 ， 令 边界 由 贡 对 平行 线 组 成 ， 它 们 的 斜率 分 别 为 0，tan(x/m)，tan(2x/m)，…， 
tan((m 一 1)nz/m)。 这 些 平行 线 必须 满足 以 下 条 件 : 

规则 1: 每 个 输入 点 都 位 于 每 对 平行 线 之 内 。 

规则 2: 每 对 平行 线 尽 可 能 地 接近 。 

现在 介绍 构建 近似 凸 包 的 在 线 算法 。 由 于 每 条 直线 上 至 少 关联 一 个 输入 点 ， 故 可 把 这 些 
点 按 顺 时 针 方向 连接 起 来 ， 形 成 一 个 近似 凸 包 。 参 见 图 12-39。 图 12-39a 所 示 为 初始 近似 凸 包 ， 
在 新 增 点 p 后 ， 新 的 近似 凸 包 如 图 12-39b 所 示 。 注 意 有 一 点 可 能 位 于 四 多 边 形 外 面 ， 这 就 是 该 
算法 称 为 近似 算法 的 原因 。 
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a) b) 
图 12-39 近似 凸 包 


在 线 近似 凸 包 算 法 4 介绍 如 下 。 





算法 12-1 计算 在 线 凸 包 算 法 A 

输入 :一 个 点 序列 p!/，p;，…， 及 使 用 的 平行 线 对 数 m。 

输出 : 近似 凸 包 序列 ww ， 2， 其 中 a 为 履 盖 点 p，， Pras o's Pj; 的 近似 凸 包 。 

初始 化 ， 构 造 斜率 分 别 为 90，tan(xim)，tan(25/m)，…，tan((m 一 1)m/m) 的 m 对 平行 线 ， 并 且 定 位 所 有 的 线 都 交 于 
第 一 个 输入 点 p1。 苟 i= 1， 也 就 是 当前 输入 点 为 p1。 

步骤 1， 对 于 m 对 平行 线 中 的 每 一 对 ， 如 果 点 p; 位 于 它们 之 间 ， 那 么 什么 也 不 做 ， 否 则 ， 不 改变 斜率 地 平移 离 p; 
最 近 的 直线 ， 使 之 与 p; 相交。 

Ml. 上 顺 时 针 方 向 连接 位 于 m 对 直线 上 的 2m 个 点 ， 使 之 形成 一 个 近似 凸 包 ， 记 为 a;。 

RS. 如 果 没 有 其 他 点 输入 ， 那 么 算法 停止 ， 否 则 ， 置 i = i+1， 令 新 接收 点 为 p; ， 转 到 步骤 1。 


算法 4 的 时 间 复 杂 度 显然 为 O(mn)， 其 中 为 使 用 的 平行 线 的 对 数 ，n 为 输入 的 点 数 。 由 于 
m 是 固定 的 ， 那 么 时 间 复 杂 度 为 0(n)。 下 面 讨论 该 近似 同 包 的 误差 。 与 算法 相关 的 有 三 种 多 边 
Ie: 

(1) 多 边 形 忆 :由 2m 条 直线 所 围 成 的 凸 封闭 多 边 形 ， 所 有 的 输入 点 都 包含 在 其 中 。 

(2) 多 边 形 C: 输入 点 所 组 成 的 凸 包 。 

(3) 多 边 形 4: 由 算法 4 所 产生 的 近似 凸 包 。 

令 L(P) 表 示 多 边 形 P 的 总 边 长 ， 则 显然 L(E) >LC) >A). 

在 线 近 似 屿 包 算法 4 产生 的 误差 率 Err(4) 为 
L(C) - L(A) 


Err(A) = LO) 





a) b) 
图 12-40 Err(4) 的 估算 
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可 以 得 到 : 





AB+ACY” (a+by 

| BC ) -a 

E a° +b’ +2ab 

~ a +b? +2ab'cos8 

_ (a +b°)/2ab+l 

(a +b’)/2ab+cos0 
l+l 

1+cos0 











= sec? Ê 
2 


Alt, AB+ ACK secs BC o 














考虑 图 12-40b。 
L(E) = P „A, + AP, + PA, +t Arp Pyy 
<sec (PF + RP, + BP tt Pay Pay) 
m 
= sec% - L(A) 
2m 


所 以 有 


Err(A) = 





L(C) 
上 式 说 明 使 用 的 平行 线 越 多 ， 如 所 期 望 的 
误差 越 小 。 表 12-1 显 示 随 m 的 增加 ，Err(4) 如 


L(C)-L(A) - LE-L4) TL 
L(A) 2m 


表 12-1 误差 率 的 上 界 





何 减 小 。 m seo Err(4) 的 上 界 
在 线 近 似 最 远 点 对 算法 与 前 一 节 所 介绍 的 2 1.4142 0.4142 
在 线 近似 凸 包 算法 很 类 似 。 在 所 有 平行 线 对 中 ， ; oops Oona 
总 是 找 出 一 对 点 ， 它 们 间 的 距离 最 远 。 位 于 这 5 1.0515 0.0515 
对 平行 线 上 的 这 两 点 用 作 该 在 线 近 似 最 远 点 对 10 1.0125 0.0125 
算法 的 输出 结果 。 20 1.0031 0.0031 


所 以 ， 除 了 步骤 2 之 外 ， 最 远 点 对 问题 的 
在 线 算法 几乎 与 算法 4 一 样 。 步 骤 2 可 修改 为 : 

步骤 2: 找 出 距离 最 远 的 一 对 平行 线 。 置 
位 于 这 对 平行 线 上 的 这 两 点 作为 在 线 近 似 最 远 
点 对 4; ， 转 到 步骤 3。 

参见 图 12-41, 令 p, 和 ps 是 准确 的 最 远 点 对 ， 
d 表示 第 i 对 平行 线 间 的 距离 ， 对 于 所 有 的 i， 
dnax 表 示 d; 中 的 最 长 距离 。 参 见 图 12-42, 令 NN; 
表示 垂直 于 第 i 对 平行 线 的 方向 ，0, 表示 最 远 点 
对 RE SN ARBA. EEA < >, Fo, 





图 12-41 精确 和 近似 的 最 远 点 对 的 例子 
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#12 ¥ 
flo, A Bb 为 di 的 平行 线 对 上 的 两 个 点 o 
可 以 得 到 如 下 : 
PP,<d,-sec6,,Wi E{l,---,m} 
< min{d, sec 0;} Ng M 
<min{d,,,, secO)} 
= d max min{sec 0} E Meee gee eee eee eee Ni 


= dsec(min{O}) 


n 
= dmax g sec 
2m 





— n 
= 0,0, 'Sec 一 一 
2m 


图 12-42 近似 最 远 点 对 与 N; 间 的 锐角 实例 

因此 ， 可 得 

误差 率 = PiP -0,0 
P\P2 


P\ Py ~ 902 
0/0, 








< 


< sec z 1 
5 2m 


随 着 m 的 增加 ， 误 差 率 的 上 界 在 碱 小 ， 如 表 12-1 所 示 。 在 第 6 章 介绍 的 1 圆心 问题 定义 如 
下 : 已 知 在 欧 儿 里 得 儿 何 空间 中 的 个 点 的 集合 ， 找 出 一 个 能 覆盖 所 有 点 的 圆 ， 且 它 的 直径 
最 短 。 在 算法 4A 中， 有 mm 对 斜率 固定 的 平行 线 ， 这 m 对 平行 线 组 成 了 册封 闭 多 边 形 E， 它 有 如 
下 性 质 : 

性 质 1: 天 覆盖 所 有 的 输入 点 。 

R2: 正中 的 顶点 数 至 多 为 2m。 

性 质 3，E 中 每 条 边 的 斜率 一 一 对 应 等 于 2m 条 边 的 正 多 边 形 的 各 斜率。 

性 质 4: E 中 的 每 条 边 上 至 少 有 一 个 点 。 

由 E 的 上 述 四 条 性 质 可 构建 对 于 输入 顶点 的 在 线 近似 最 小 圆 算法 。 同 理 ，1 贺 心 问题 除了 
步 又 2 之 外 ， 在 线 近 似 最 小 圆 算法 与 近似 凸 包 算法 4 几乎 一 样 。 步 又 2 修改 为 : 

步骤 2: 找 出 凸 多 边 形 下 的 顶点 ， 即 两 直线 的 交点 。 使 用 任何 离线 1 圆心 算法 解决 这 个 最 多 
包含 2m 个 输入 顶点 的 1 圆心 问题 ， 令 这 个 圆 为 在 线 近似 圆 4, 。 

找 出 多 边 形 E 的 顶点 的 时 间 复 杂 度 为 O0(m) (性 质 2) ， 找 出 覆盖 2m 个 点 的 圆 的 时 间 复 杂 度 
是 一 个 常数 ， 因 为 只 涉及 一 个 固定 的 点 数 。 

根据 定义 ， 通 过 算法 找 出 的 圆 履 盖 凸 封闭 多 边 形 E， 根 据 性 质 1， 它 也 覆盖 所 有 的 输入 点 。 
下 面 的 问题 是 分 析 在 线 近似 最 小 加 有 多 好 。 所 用 的 方法 称 为 竞争 分 析 (compeititive analysis), 
令 d(C) 表 示 圆 C 的 直径 长 度 ， 已 知 一 个 点 序列 ， 令 Co 和 Cw 分 别 表示 覆盖 所 有 这 列 点 的 最 小 
圆 和 在 线 近 似 较 。 如 果 所 有 的 点 位 于 平面 上 ， 那 么 1 圆心 问题 的 在 线 算 法 是 cs 可 竞争 的 ， 且 


A 
d(C,n ) s Ci d(C op ) , Ja ik Wc, 是 SC o 
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ARC, ， 可 构造 一 个 2m 条 边 的 正 多 边 形 R 和 包含 所 有 点 的 2m 对 相同 斜率 的 平行 线 。 令 EE 
表示 由 这 2m 对 平行 线 所 构成 的 多 边 形 。 如 图 12-43 所 4 
T, ECR, SC, 表示 覆盖 R 的 最 小 圆 ， 由 于 已 CR， ` 
故此 最 小 圆 槛 盖 巨 ， 即 C,， ， 且 小 于 等 于 C 。 由 于 
Cm 为 履 盖 所 有 点 的 最 优 贺 ， 所 以 有 d(C ) <d(Cow) 
<d(C,). BWA12-43, OBAC, WEE, 0AA 
Ci 的 半径 。 可 以 得 到 


rx 
d(C) Sec =d(C,) 





因此 ， 
dC) -dc _OA_ aT i 
d(C,,) dC) OB 2m 图 12-43 E 与 R 间 的 关系 


这 就 是 说 ， 本 节 所 介绍 的 在 线 算法 是 sec(/(2m)) 可 竞争 的 。 
12.7 基于 随机 策略 的 在 线 生成 树 算法 


一 般 说 来 ， 在 每 一 决策 步 中 具有 和 较 少 空间 和 较 低 时 间 复 杂 度 的 在 线 算法 的 性 能 对 于 在 线 
问题 是 非常 重要 的 ， 因 为 在 实际 应 用 中 〈 例 如 ， 实 时 系统 ) ， 当 数据 到 达 时 ， 要 尽 可 能 快 地 做 
出 决策 。 所 以 ， 为 了 满足 低 算 法 复杂 度 和 空间 要 求 的 在 线 算法 在 决策 步 的 随机 性 便 成 为 在 线 
算法 的 设计 策略 。 在 本 节 中 ， 将 介绍 一 个 简单 的 随机 算法 来 解决 在 线 生 成 树 问 题 ， 该 问题 在 
12.1 节 中 定义 。 

解决 欧 儿 里 得 树 的 随机 在 线 算法 R(m) 介 绍 如 下 。 








算法 12-2 计算 在 线 欧 几 里 得 生成 树 的 算法 R(m) 


WA: 欧 儿 时 得 空间 中 的 a(>3) 个 点 ，…，v 和 一 个 正 整 数 m( <n 1), 
输出 ， 欧 几时 得 树 T 
Begin 
T=9; 
input(7) ; 
input(v,); 
input(v,),; 
添加 连接 v, 和 v, 的 边 到 7， 
For k = 3 to n do 
input(y, ); 
If k<m +1 then 
RIM, 到 ww ，…， -的 最 短 边 到 7 
else 
bY, Bly. oo YOK R APRENE RR, Rm 条 边 中 的 最 短 边 添加 到 TT， 
Endfor 
output(7),; 
End 





依据 输入 序列 的 次 序 ， 算 法 RGm) 依 次 接收 输入 点 ， 当 新 的 一 个 点 到 来 时 ， 算 法 做 出 决定 
构造 到 目前 为 止 接收 的 已 知 点 的 生成 树 ， 且 所 有 决策 一 经 生成 就 不 再 改变 。 假 设 当前 检查 第 ; 
个 输入 点 〈 比 如 w )。 如 果 2<i<m +1， 那 么 算法 R(m) 把 当前 检查 的 点 与 先前 检查 过 的 点 比 
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Av, e v) 闻 的 最 短 边 添加 到 生成 树 中 从 而 形成 新 的 生成 树 ， 否 则 ， 从 当前 点 与 先前 输 
入 点 形成 的 边 中 随机 选择 m 条 边 ， 把 这 m 条 边 中 的 最 短 边 添 加 到 原先 的 生成 树 中 从 而 形成 新 
的 生成 树 。 在 每 个 检查 步 花 费 的 时 间 是 O(m)， 不 难看 出 算法 R(n 一 1) 是 以 前 所 介绍 的 确定 性 
贪心 算法 。 

假如 已 知 平面 上 的 4 个 点 ， 如 图 12-44a 所 示 ， 点 的 输入 序列 是 1，2，3，4， 构 造 一 棵 生成 
树 ， 由 算法 R(2) 将 产生 如 图 12-44b 所 示 的 生成 树 。 表 12-2 给 出 了 算法 R(2) 在 输入 序列 为 1 2, 
3，4 的 执行 过 程 ， 其 中 e(a，b) 表 示 连 接点 a 和 4b 的 边 ，le(la，b)| 表 示 e(a，5) 的 欧 几 里 得 距离 。 


je 1 


e2 2 
a) 输入 的 点 b) 输入 的 序列 
12-44 算法 R(2) 的 一 个 例子 


表 12-2 算法 R(2) 处 理 输入 序列 1，2，3，4 的 执行 动作 








当前 输入 的 点 D ft 
1 No action 
2 Add e(1，2)to 了 
3 Add e(3, 1) to 了 
(le(3, DI= min{le(3, 1), le(3, 2) 
4 Choose e(4, 1) and e(4, 2), and add e(4, 2) to 了 


(le(4, 2) = min{le(4, Dl. le(4, 2)1}) 

随机 在 线 算法 A 称 为 < 可 竞争 的 ， 如 果 存在 一 个 常数 b， 使 得 E(C, (0)) <c .Co (0) +b, X 
PEC (外) 表示 在 给 入 为 o 的 算法 A 的 其 望 代价 

下 面 将 证 明 ， 如 果 m 是 个 固定 的 常数 ， 那 么 在 线 生成 树 算法 Rm) 的 竞争 比 是 @()。 

假设 已 知 n 个 点 1， 2， nts n 的 集合 o， 且 点 的 输入 序列 是 1， 2， 4Dla, 5b) 表 示 点 a 
和 b 间 的 距离 ，N(a， 信 表示 点 4 与 目前 为 止 所 有 点 中 的 第 k 个 最 近 点 。E(Lwws(o)) 表 示 由 算法 
Rom 在 输入 为 o 时 所 产生 的 生成 树 的 期 望 长 度 。 假 设 算法 RUm) 读 入 点 i。 如 果 2<ism +, WA 
算法 RGm) 把 ;和 先前 已 知 的 1 一 1 个 点 中 离 它 最 近 的 点 相连 接 :如果 m 42<i<n， 那 么 算法 Rn) 把 
条 先前 已 和 的 | ! 个 点 中 高 它 最 近 的 第 个 点 以 概率 ，T] /( meg, epi<, 
对 于 ELLuw(o)) 有 下 面 的 公式 : 

E(Lrm)(0)) 


n+} n im i-l- j i-l _ 
= X D(i,N(i,1 ‘DG, N(i, 
5 GNC p+ SSC MG) aay 
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令 n 个 点 位 于 同一 直线 且 点 位 于 CO SCD (A= IDE 其 中 se>0 (图 12-45 所 示 )。 








一 1/2 0 1/2 
oe _e— — 全 一 全 一 由 
E€ € € E 
2 4 6 ... ... 5 3 | 


图 12-45 7 个 点 位 于 同一 直线 
如 果 s 的 值 无 限 小 ， 那 么 可 得 
Oif 1<j<i-[i/2]-1 
l ifi< fi/2]j<i-1 
令 o* 表 示 上 述 的 输入 点 ， 如 果 输 入 序列 为 1，2，…，m， 那 么 由 公式 (12-11) 可 得 : 
E(Ln nfo) 


Sn/ 
A 
| 
E(w A) 


m 


(i-2k +1) 
1 kaufm J+! 
slt > mi2 
i=2m+1 JE- 





由 于 mm 为 常数 ， 所 以 可 得 


mi2 2m2- n US! 2[m/2]-1 m/21- 
ZH - J> Er 六 i= 2k 


十 一 一 1 peg |o 
2m-1 2m-3 2m+1-2[m/2] 
1 1 1 1 1 1 
十 一 一 十 十 二 一 十 一 十 一 十 十 一 一 十 … 
2m 2m-2 2m+2-2[m/2] 2m-1 2m-1 2m+3-2[m/ 2] 


= (n- 2m) -(2[m/2]- rfl 








1 1 1 
十 + +e 
n-2 n-4 n~-2[m/2] 


fri2] n 1 
= (n= 2m) ~(2[m/2]- o| Se. a- Hea) a H, =$) 


=n-2m-o(n) 
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这 样 kd 
E( Lgm (0*)) 


stat [(- =) 
2” i=ż2m+\ k= i- 2k 


n-2m-o(n) 
2” 
BL nan (O BARBI A AO 的 最 小 生成 树 的 长 度 ， 易 知 L,,(o') = 1， 因 此 ， 


E( Leem (O*)) + n-2m-o(n) 
Do 7 2" 


FA el, EERE OAR) BIEN REEN), APAA ARE, my 
定 的 常数 。 

令 D 表 示 n 个 点 的 直径 ， 最 小 施 泰 纳 树 (minimum Steiner tree) 与 最 小 生成 树 的 长 度 大 于 
或 等 于 DD。 因 为 每 条 边 的 长 度 小 于 或 等 于 ， 所 以 由 任何 在 线 算法 所 产生 的 生成 树 的 长 度 小 于 
或 等 于 (n 一 1)D。 因 此 ， 对 于 在 线 生成 树 问 题 ， 没 有 在 线 算法 的 竞争 比 大 于 n 一 1， 其 中 n 为 输 
入 点 的 数目 。 

基于 上 面 的 结论 ， 可 得 在 线 生 成 树 问 题 的 算法 R(m) 的 竞争 比 是 B(n)， 其 中 为 输入 点 的 数 
目 ，m 为 固定 的 常数 。 


12.8 注释 与 参考 


在 线 施 泰 纳 树 问 题 与 在 线 生成 树 回 题 相 似 ， 是 找 出 一 棵 在 线 施 泰 纳 树 ， 其 中 的 结 点 也 是 
一 个 接 一 个 地 出 现 。 在 文献 Imase and Waxman(1991) 和 Alon and Azar(1993) 中 ， 对 12.1 节 中 两 
个 问题 的 贪心 算法 的 竞争 比 证 明 是 logan。 此 外 ， 文献 Alon and Azar(1993) 还 证 明了 在 线 生成 
树 和 施 泰 纳 树 问 题 的 任何 在 线 算法 的 竞争 比 的 下 界 为 @(log n/log log n)。 

如 果 从 点 i 到 点 j 的 距离 与 从 ;到 i 的 距离 相等 ， 那 么 服务 员 问 题 称 为 对 称 的 问题 ， 否 则 称 为 
非 对 称 的 问题 。 解 决 k 服 务 员 问题 的 在 线 算法 要 在 具备 一 定 条 件 下 执行 ， 即 要 在 执行 之 前 决定 
移动 哪 名 服务 员 能 满足 当前 请 求 而 不 必 知 道 将 来 的 请 求 。 

例如 高 速 缓存 问题 ， 页 面 分 配 问 题 ， 双 磁盘 磁头 问题 ， 线 性 搜索 问题 等 ， 在 选择 了 顶点 
与 服务 员 数 量 之 间距 离 后 可 抽象 为 服务 员 问 题 。 

文献 Manasse，McGeoch and Sleator(1990) 于 1990 年 引入 了 服务 员 问 题 ， 他 们 证 明了 k 是 解 
决 k 服 务 员 问题 算法 的 竞争 比 下 限 。 而 基于 平面 树 的 Kk 服务员 最 优 算法 在 文献 Chrobak and 
Larmore(1991) 中 提出 。 

穿越 障碍 物 问 题 是 在 Papadimitriou and Yannakakis(1991b) 中 首次 提出 的 。 他 们 证 明 当 障 
碍 物 的 边 与 坐标 轴 平 行 时 的 确定 算法 的 竞争 比 下 界 为 Q(Vd) ， 其 中 4 为 s 和 1! 间 的 距离 。 如 果 所 
有 障碍 物 都 是 相同 边 长 的 方形 ， 且 边 都 与 坐标 轴 平 行 ， 那 么 他 们 同时 提出 了 渐 近 最 优 竞 争 比 
为 3/2 的 算法 。 


在 12.3 节 中 使 用 的 不 等 式 T < Eak T < 在 文献 Fejes(1978) 中 证 明 。 
1 = T 


一 1 + 


二 分 匹配 问题 是 在 文献 Kalyanasundaram and Pruhs(1993) 中 提出 的 ， 在 12.4 节 中 介绍 的 算 
法 及 问题 的 下 限 也 是 在 文献 Kalyanasundaram and Pruhs(1993) 中 给 出 。 
在 1996 年 ，Graham 提 出 了 解决 m 台 机 器 调度 问题 的 简单 贪心 算法 ， 称 为 List。 他 证 明了 该 
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算法 的 竞争 比 为 (2 一) 。 在 12.5 节 中 提 到 的 竞争 比 为 {2- 二) 的 解决 m 台 机 器 调度 问题 的 算法 
是 在 文献 Bartal，Fiat，Karloff and Vahra(1995) 中 提出 的 ， 其 中 m 宇 70。 


在 12.6 节 中 解决 几何 问题 的 在 线 算 法 可 在 文献 Chao(1992) 中 找到 。 在 12.7 节 中 解决 在 线 生 
成 树 的 随机 算法 在 文献 Tsai 和 Tang(1993) 中 有 讨论 。 


12.9 进一步 的 阅读 资料 


SCHKManasse, McGeoch and Sleator(1990) 证 明了 对 称 2 服 务 员 问题 的 确定 型 在 线 算法 的 最 
优 竞 争 比 为 2， 并 猜测 对 于 c<k， 至 少 有 k +1 个 顶点 的 任意 度量 空间 ，k 服 务 员 问题 没有 确定 的 
竞争 比 为 的 在 线 算法 。 文 献 Koutsoupias and Papadimitriou(1995) 已 经 证 明了 解决 :服务 员 问 题 
的 工作 函数 算法 的 竞争 比 最 大 为 2k 一 1， 但 猜测 迄今 还 没有 被 证 明 或 反 甬 。 

文献 Chan and Lam(1993) 提 出 了 对 于 穿越 障碍 物 问 题 的 非 对 称 最 优 的 (1 +r/2) 竞 争 算法 ， 
其中 每 个 障碍 物 有 某 个 常数 限界 的 高 宽 比 (长 边 与 短 边 的 长 度 比 ) 。 

文献 Khuller，Mitchell and Vazirani(1994) 提 出 了 带 权 匹 配 和 稳定 合并 的 在 线 算法 。 在 文 
献 KKarp ，Vazirani(1990) 和 Kao，Tate(1991) 中 讨论 了 无 权 图 的 二 分 匹配 问题 。 

文献 Karger，Phillips and Torng(1994) 提 供 了 一 个 解决 m 台 机 器 调度 问题 的 算法 ， 对 于 所 
有 的 m， 该 算法 的 竞争 比 至 多 是 1.945， 且 对 于 mr 之 6， 它 优 于 List 算 法 。 

许多 有 趣 的 在 线 算法 正在 研究 中 ， 如 测量 任务 系统 : Borodin, Linial and Saks(1992); 在 
线装 箱 问 题 :， Csirik(1989)，Lee and Lee(1985); Vliet(1992), 在 线 图 着 色 问 题 : 
Vishwanathan(1992)， 在 线 财政 问题 ， El-Yaniv(1998) 等 。 

下 面 所 列 的 是 感 兴趣 的 较 新 的 研究 成 果 : Adamy and Erlebach(2003); Albers(2002), 
Albers and Koga(1998); Albers and Leonardi(1999); Alon, Awerbuch and Azar(2003); 
Aspnes, Azar, Fiat, Plotkin and Waarts(1997), Awerbuch and Peleg(1995); Awerbuch and 
Singh(1997); Awerbuch, Azar and Meyerson(2003),; Azar, Blum and Mansour(2003); Azar, 
Kalyanasundaram, Plotkin, Pruhs and Waarts(1997), Azar, Naor and Rom(1995); Bachrach 
and ElYaniv(!1997), Bareli, Berman, Fiat and Yan(1994), Bartal and Grove(2000),; Berman, 
Charikar and Karpinski(2000); Bern, Greene, Raghunathan and Sudan(1990); Blum, 
Sandholm and Zinkevich(2002), Caragiannis, Kaklamanis and Papaioannou(2003), 
Chan(1998), Chandra and Vishwanathan(1995),; Chazelle and Matousek(1996),; Chekuri, 
Khanna and Zhu(2001); Conn and Vonholdt(1965); Coppersmith, Doyle, Raghavan and 
Snir(1993),; Crammer and Singer(2002), El-Yaniv(1998), Epstein and Ganot(2003); Even and 
Shiloach(1981); Faigle, Kern and Nawijn(1999),; Feldmann, Kao, Sgall and Teng(1993), 
Galil and Seiferas(1978), Garay, Gopal, Kutten, Mansour and Yung(1997); Goldman, 
Parwatikar and Suri(2000),; Gupta, Konjevod and Varsamopoulos(2002); Haas and 
Hellerstein( 1999), Halldorsson(!997), Halperin, Sharir and Goldberg(2002), Irani, Shukla 
and Gupta(2003); Janssen, Krizanc, Narayanan and Shende(2000); Jayram, Kimbrel, 
Krauthgamer, Schieber and Sviridenko(2001),; Kalyanasundaram and Pruhs(1993),; Keogh, 
Chu, Hart and Pazzani(2001),; Khuller, Mitchell and Vazirani(1994), Klarlund(1999), 
Kolman and Scheideler(200!); Koo, Lam, Ngan, Sadakane and To(2003); Kossmann, 
Ramsak and Rost(2002); Lee(2003a); Lee(2003b); Lueker(1998); Manacher(1975); Mandic 
and Cichocki(2003), Mansour and Schieber(1992); Megow and Schulz(2003),; Oza and 
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Russell(2001); Pandurangan and Upfal(2001); Peserico(2003), Pittel and Weishaar(1997), 
Ramesh(1995), Seiden(1999), Seiden(2002); Sgall(1996); Tamassia(1996); Tsai, Lin and 


Hsu(2002); Tsai, Tang and Chen(1994), Tsai, Tang and Chen(1996); Ye and Zhang(2003), 
and Young(2000) , 


习题 


12.1 考虑 在 12.4 节 中 介绍 的 二 分 匹配 问题 ， 当 8 中 的 某 点 b; SLAM, Wb 与 集合 R 中 与 它 最 近 
且 没 有 匹配 的 点 相 匹 配 ， 这 样 的 算法 是 (2n 一 1) 可 竞争 的 吗 ? 证 明之 。 

12.2 已 知 由 点 集 R 和 B 形 成 的 二 分 带 权 图 ， 它 们 的 基数 都 为 :， 最 大 二 分 匹配 问题 是 找到 花费 
代价 最 大 的 二 分 匹配 。 假 设 所 有 的 边 权 值 满足 三 角 不 等 式 。 如 果 R 中 的 点 事先 已 知 而 B 
中 的 点 依次 出 现 ， 那 么 总 是 将 到 来 的 顶点 与 R 中 最 远 的 尚未 匹配 点 相 匹配 的 贪心 算法 竞 
争 比 是 多 少 ? 

12.3 证 明 在 12.2 节 中 所 介绍 的 x 服务员 算法 ， 当 服务 员 排 成 一 列 时 其 竞争 比 也 为 k。 

12.4 如 果 方 形 障碍 物 具 有 任意 方向 ， 那 么 在 12.3 节 中 介绍 的 穿越 障碍 物 算法 的 竞争 比 是 3/2 可 
竞争 的 吗 ? 并 证 明之 。 
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